Brian Walker
可能讓人覺得很奇怪,但好像的確沒有什么“正式的”T-SQL 編碼標(biāo)準(zhǔn)。早在 1999 年末的時候,我驚喜地發(fā)現(xiàn) John Hindmarsh 提出的 SQL Server 7.0 標(biāo)準(zhǔn),我在 2000 年 2 月的社論中對他的某些建議進(jìn)行了總結(jié)。(2000 年 2 月以及本月的“下載”中都包括了 John 原來的標(biāo)準(zhǔn)。)后來,Ron Talmage 撰寫了一系列專欄文章,提出了他對各種“最佳方法”的建議,當(dāng)然,SQL Server 小組也已正式發(fā)布了 SQL Server 最佳方法分析器 (SQLBPA)。現(xiàn)在,一位具有超過 25 年經(jīng)驗(yàn)的數(shù)據(jù)庫管理員和應(yīng)用程序開發(fā)員 Brian Walker 又提出了他的建議和提示。
進(jìn)行 T-SQL 編程時常常會忽略編碼標(biāo)準(zhǔn),但這些標(biāo)準(zhǔn)卻是開發(fā)小組順利開展工作的關(guān)鍵工具。這里介紹的編碼標(biāo)準(zhǔn)是我多年的開發(fā)成果。它們當(dāng)然還沒有得到普遍接受,而且不可否認(rèn),有些標(biāo)準(zhǔn)帶有主觀色彩。我的目的實(shí)際上更多的是為了提高大家的意識,而不是吹捧自己是 T-SQL 樣式方面的仲裁者:最重要的是要建立某些合理的編碼標(biāo)準(zhǔn)并遵循這些標(biāo)準(zhǔn)。您在這篇文章中會發(fā)現(xiàn)有關(guān) T-SQL 編程的一系列不同的編碼標(biāo)準(zhǔn)、技巧和提示。它們并未以任何特定的優(yōu)先級或重要性順序列出。
讓我們從格式開始。表面上,T-SQL 代碼的格式似乎并不重要,但一致的格式可以使您的同事(不論是同一小組的成員還是更大范圍的 T-SQL 開發(fā)團(tuán)隊(duì)的成員)更輕松地瀏覽和理解您的代碼。T-SQL 語句有一個結(jié)構(gòu),遵循一目了然的結(jié)構(gòu)使您可以更輕松地查找和確認(rèn)語句的不同部分。統(tǒng)一的格式還使您可以更輕松地在復(fù)雜 T-SQL 語句中增刪代碼段,使調(diào)試工作變得更容易。下面是 SELECT 語句的格式示例:
SELECT C.Name , E.NameLast , E.NameFirst , E.Number , ISNULL(I.Description,'NA') AS Description FROM tblCompany AS C JOIN tblEmployee AS E ON C.CompanyID = E.CompanyID LEFT JOIN tblCoverage AS V ON E.EmployeeID = V.EmployeeID LEFT JOIN tblInsurance AS I ON V.InsuranceID = I.InsuranceID WHERE C.Name LIKE @Name AND V.CreateDate > CONVERT(smalldatetime, '01/01/2000') ORDER BY C.Name , E.NameLast , E.NameFirst , E.Number , ISNULL(I.Description,'NA') SELECT @Retain = @@ERROR, @Rows = @@ROWCOUNT IF @Status = 0 SET @Status = @Retain
?一個嵌套代碼塊中的語句使用四個空格的縮進(jìn)。(上述代碼中的多行 SELECT 語句是一個 SQL 語句。)在同一語句中開始新行時,使 SQL 關(guān)鍵字右對齊。將代碼編輯器配置為使用空格,而不是使用制表符。這樣,不管使用何種程序查看代碼,格式都是一致的。
?大寫所有的 T-SQL 關(guān)鍵字,包括 T-SQL 函數(shù)。變量名稱及光標(biāo)名稱使用混和大小寫。數(shù)據(jù)類型使用小寫。
?表名別名要簡短,但意義要盡量明確。通常,使用大寫的表名作為別名,使用 AS 關(guān)鍵字指定表或字段的別名。
?當(dāng)一個 T-SQL 語句中涉及到多個表時,始終使用表名別名來限定字段名。這使其他人閱讀起來更清楚,避免了含義模糊的引用。
?當(dāng)相關(guān)數(shù)字出現(xiàn)在連續(xù)的代碼行中時(例如一系列 SUBSTRING 函數(shù)調(diào)用),將它們排成列。這樣容易瀏覽數(shù)字列表。
?使用一個(而不是兩個)空行分隔 T-SQL 代碼的邏輯塊,只要需要就可以使用。
?聲明 T-SQL 局部變量(例如 @lngTableID)時,使用適當(dāng)?shù)臄?shù)據(jù)類型聲明和一致的大寫。
?始終指定字符數(shù)據(jù)類型的長度,并確保允許用戶可能需要的最大字符數(shù),因?yàn)槌鲎畲箝L度的字符會丟失。
?始終指定十進(jìn)制數(shù)據(jù)類型的精度和范圍,否則,將默認(rèn)為未指定精度和整數(shù)范圍。
?使用錯誤處理程序,但要記住行首 (BOL) 中的錯誤檢查示例不會象介紹的那樣起作用。用來檢查 @@ERROR 系統(tǒng)函數(shù)的 T-SQL 語句 (IF) 實(shí)際上在進(jìn)程中清除了 @@ERROR 值,無法再捕獲除零之外的任何值。(即使示例起作用,它們也只能捕獲最后發(fā)生的一個錯誤,而不是您更想捕獲的第一個錯誤。)必須使用 SET 或 SELECT 立即捕獲錯誤代碼,如前面示例所示。如果狀態(tài)變量仍然為零,應(yīng)轉(zhuǎn)換到狀態(tài)變量。
?避免使用“未聲明的”功能,例如系統(tǒng)表中未聲明的列、T-SQL 語句中未聲明的功能或者未聲明的系統(tǒng)存儲過程或擴(kuò)展的存儲過程。
?不要依賴任何隱式的數(shù)據(jù)類型轉(zhuǎn)換。例如,不能為數(shù)字變量賦予字符值,而假定 T-SQL 會進(jìn)行必要的轉(zhuǎn)換。相反,在為變量賦值或比較值之前,應(yīng)使用適當(dāng)?shù)?CONVERT 函數(shù)使數(shù)據(jù)類型相匹配。另一個示例:雖然 T-SQL 會在進(jìn)行比較之前對字符表達(dá)式進(jìn)行隱式且自動的 RTRIM,但不能依賴此行為,因?yàn)榧嫒菪约墑e設(shè)置非字符表達(dá)式會使情況復(fù)雜化。
?不要將空的變量值直接與比較運(yùn)算符(符號)比較。如果變量可能為空,應(yīng)使用 IS NULL 或 IS NOT NULL 進(jìn)行比較,或者使用 ISNULL 函數(shù)。
?不要使用 STR 函數(shù)進(jìn)行舍入,此函數(shù)只能用于整數(shù)。如果需要十進(jìn)制值的字符串形式,應(yīng)先使用 CONVERT 函數(shù)(轉(zhuǎn)至不同的范圍)或 ROUND 函數(shù),然后將其轉(zhuǎn)換為字符串。也可以使用 CEILING 和 FLOOR 函數(shù)。
?使用數(shù)學(xué)公式時要小心,因?yàn)?T-SQL 可能會將表達(dá)式強(qiáng)制理解為一個不需要的數(shù)據(jù)類型。如果需要十進(jìn)制結(jié)果,應(yīng)在整數(shù)常量后加點(diǎn)和零 (.0)。
?決不要依賴 SELECT 語句會按任何特定順序返回行,除非在 ORDER BY 子句中指定了順序。
?通常,應(yīng)將 ORDER BY 子句與 SELECT 語句一起使用。可預(yù)知的順序(即使不是最方便的)比不可預(yù)知的順序強(qiáng),尤其是在開發(fā)或調(diào)試過程中。(部署到生產(chǎn)環(huán)境中之前,可能需要刪除 ORDER BY 子句。)在返回行的順序無關(guān)緊要的情況下,可以忽略 ORDER BY 的開銷。
?不要在 T-SQL 代碼中使用雙引號。應(yīng)為字符常量使用單引號。如果沒有必要限定對象名稱,可以使用(非 ANSI SQL 標(biāo)準(zhǔn))括號將名稱括起來。
?在 SQL Server 2000 中,盡量使用表變量來代替臨時表。如果表變量包含大量數(shù)據(jù),請注意索引非常有限(只有主鍵索引)。
?先在例程中創(chuàng)建臨時表,最后再顯式刪除臨時表。將 DDL 與 DML 語句混合使用有助于處理額外的重新編譯活動。
?要認(rèn)識到臨時表并不是不可使用,適當(dāng)?shù)厥褂盟鼈兛梢允鼓承├谈行В纾?dāng)需要重復(fù)引用大型表或常用表中的某個數(shù)據(jù)集時。但是,對于一次性事件,最好使用導(dǎo)出表。
?使用表值 UDF 時要小心,因?yàn)樵谧兞浚ǘ皇浅A浚┲袀鬟f某個參數(shù)時,如果在 WHERE 子句中使用該參數(shù),會導(dǎo)致表掃描。還要避免在一個查詢中多次使用相同的表值 UDF。但是,表值 UDF 確實(shí)具有某些非常方便的動態(tài)編譯功能。[相關(guān)資料:參閱 Tom Moreau 在 2003 年 11 月份“生成序列號”專欄中的“使用 UDF 填充表變量”。-編者按]
?幾乎所有的存儲過程都應(yīng)在開始時設(shè)置 SET NOCOUNT ON,而在結(jié)束時設(shè)置 SET NOCOUNT OFF。[SET NOCOUNT ON 使 SQL Server 無需在執(zhí)行存儲過程的每個語句后向客戶端發(fā)送 DONE_IN_PROC 消息。- 編者按] 此標(biāo)準(zhǔn)同樣適用于觸發(fā)器。
?只要在例程中使用多個數(shù)據(jù)庫修改語句,包括在一個循環(huán)中多次執(zhí)行一個語句,就應(yīng)考慮聲明顯式事務(wù)。
?使用基于光標(biāo)的方法或臨時表方法之前,應(yīng)先尋找基于集的解決方案來解決問題。基于集的方法通常更有效。
?與臨時表一樣,光標(biāo)并不是不可使用。對小型數(shù)據(jù)集使用 FAST_FORWARD 光標(biāo)通常要優(yōu)于其他逐行處理方法,尤其是在必須引用幾個表才能獲得所需的數(shù)據(jù)時。在結(jié)果集中包括“合計”的例程通常要比使用光標(biāo)執(zhí)行的速度快。如果開發(fā)時間允許,基于光標(biāo)的方法和基于集的方法都可以嘗試一下,看哪一種方法的效果更好。
?使用包含序號(從 1 到 N)的表很方便。
?理解 CROSS JOIN 的工作原理并加以利用。例如,您可以在工作數(shù)據(jù)表和序號表之間有效地使用 CROSS JOIN,結(jié)果集中將包含每個工作數(shù)據(jù)與序號組合的記錄。
?我的結(jié)束語是:T-SQL 代碼往往很簡潔,因此如果某個代碼塊看起來很難處理或重復(fù)內(nèi)容較多,那么可能存在一種更簡單,更好的方法。
結(jié)論
如果您對我的建議有任何看法,歡迎隨時向我發(fā)送電子郵件進(jìn)行討論,也可以就其他問題提出您的建議。我希望您將此作為談話的開場白。
其他信息:摘自 Karen 2000 年 2 月份的社論
在標(biāo)準(zhǔn)開發(fā)的前沿陣地上,有一股以 SQL Server 數(shù)據(jù)庫管理員 John Hindmarsh 為首的獨(dú)立的新生力量。MCT、MCSE 和 MCDBA 都是最值得您花時間去研究的。John 的貢獻(xiàn)是撰寫了一份詳細(xì)的白皮書,概述了他對各種 SQL Server 相關(guān)標(biāo)準(zhǔn)提出的建議。我所知道的其他唯一提出類似建議的文章是 Andrew Zanevsky 的《Transact-SQL Programming》(ISBN 1-56592-401-0) 中的“Format and Style”一章。Andrew、SQL Server Professional 的投稿人 Tom Moreau 和 Paul Munkenbeck 以及 John 的朋友兼同事 Stephen James 都為 John 的白皮書做出過貢獻(xiàn)。下面是 John 為編寫存儲過程提供的建議示例:
• |
使用 SQL-92 標(biāo)準(zhǔn)連接句法。 |
• |
為了提高性能,應(yīng)優(yōu)先使用連接,然后使用子查詢或嵌套查詢。 |
• |
確保變量和參數(shù)的類型和大小與表數(shù)據(jù)列相匹配。 |
• |
確保使用所有變量和參數(shù),或者全部刪除。 |
• |
盡可能將臨時對象放置在本地。 |
• |
只使用在存儲過程中創(chuàng)建的臨時表。 |
• |
檢查輸入?yún)?shù)的有效性。 |
• |
優(yōu)先使用 SELECT...INTO,然后使用 INSERT...SELECT,以避免大量死鎖。 |
• |
維護(hù)工作需要的邏輯單元;在可以縮短的情況下,不要創(chuàng)建大量或長時間運(yùn)行的進(jìn)程。 |
• |
不要在任何代碼中使用 SELECT *。 |
• |
在過程中使用縮進(jìn)、塊、制表符和空格(參閱示例腳本)。 |
• |
T-SQL 語句要大寫。 |
• |
在過程中添加大量注釋,確保可以識別進(jìn)程。在有助于澄清處理步驟的地方使用行注釋。 |
• |
包括事務(wù)管理,除非要從 MTS 進(jìn)程中調(diào)用過程。(為 MTS 進(jìn)程編寫?yīng)毩⒌倪^程。) |
• |
監(jiān)視 @@TRANCOUNT 以確定事務(wù)的責(zé)任級別。 |
• |
避免使用 GOTO,錯誤處理程序中除外。 |
• |
避免使用嵌套過程。 |
• |
避免隱式解析對象名稱,確保所有對象都?xì)w dbo 所有。 |
有關(guān) SQL Server Professional 和 Pinnacle Publishing 的詳細(xì)信息,請訪問其 Web 站點(diǎn) http://www.pinpub.com/
注意:這不是 Microsoft Corporation 的 Web 站點(diǎn)。Microsoft 對該 Web 站點(diǎn)上的內(nèi)容不承擔(dān)任何責(zé)任。
本文轉(zhuǎn)載自 2004 年 12 月份的 SQL Server Professional。除非另行說明,否則版權(quán)所有 2004 Pinnacle Publishing, Inc.。保留所有權(quán)利。SQL Server Professional 是 Pinnacle Publishing 獨(dú)立發(fā)行的刊物。未經(jīng) Pinnacle Publishing, Inc. 事先同意,不得以任何方式使用或復(fù)制本文的任何部分(評論文章中的簡短引用除外)。如需與 Pinnacle Publishing, Inc. 聯(lián)系,請撥打 1-800-788-1900。
© 2005 Microsoft Corporation 版權(quán)所有。保留所有權(quán)利。使用規(guī)定。
原文出處:http://www.microsoft.com/china/msdn/library/data/sqlserver/sp04l9.mspx?mfr=true
ORACLE 的解析器按照從右到左的順序處理FROM子句中的表名,FROM子句中寫在最后的表(基礎(chǔ)表 driving table)將被最先處理,在FROM子句中包含多個表的情況下,你必須選擇記錄條數(shù)最少的表作為基礎(chǔ)表。如果有3個以上的表連接查詢, 那就需要選擇交叉表(intersection table)作為基礎(chǔ)表, 交叉表是指那個被其他表所引用的表.
(2) WHERE子句中的連接順序.:
ORACLE采用自下而上的順序解析WHERE子句,根據(jù)這個原理,表之間的連接必須寫在其他WHERE條件之前, 那些可以過濾掉最大數(shù)量記錄的條件必須寫在WHERE子句的末尾.
(3) SELECT子句中避免使用 ‘ * ‘:
ORACLE在解析的過程中, 會將'*' 依次轉(zhuǎn)換成所有的列名, 這個工作是通過查詢數(shù)據(jù)字典完成的, 這意味著將耗費(fèi)更多的時間
(4) 減少訪問數(shù)據(jù)庫的次數(shù):
ORACLE在內(nèi)部執(zhí)行了許多工作: 解析SQL語句, 估算索引的利用率, 綁定變量 , 讀數(shù)據(jù)塊等;
(5) 在SQL*Plus , SQL*Forms和Pro*C中重新設(shè)置ARRAYSIZE參數(shù), 可以增加每次數(shù)據(jù)庫訪問的檢索數(shù)據(jù)量 ,建議值為200
(6) 使用DECODE函數(shù)來減少處理時間:
使用DECODE函數(shù)可以避免重復(fù)掃描相同記錄或重復(fù)連接相同的表.
(7) 整合簡單,無關(guān)聯(lián)的數(shù)據(jù)庫訪問:
如果你有幾個簡單的數(shù)據(jù)庫查詢語句,你可以把它們整合到一個查詢中(即使它們之間沒有關(guān)系)
(8) 刪除重復(fù)記錄:
最高效的刪除重復(fù)記錄方法 ( 因?yàn)槭褂昧?/span>ROWID)例子:
DELETE FROM EMP E WHERE E.ROWID > (SELECT MIN(X.ROWID)
FROM EMP X WHERE X.EMP_NO = E.EMP_NO);
(9) 用TRUNCATE替代DELETE:
當(dāng)刪除表中的記錄時,在通常情況下, 回滾段(rollback segments ) 用來存放可以被恢復(fù)的信息. 如果你沒有COMMIT事務(wù),ORACLE會將數(shù)據(jù)恢復(fù)到刪除之前的狀態(tài)(準(zhǔn)確地說是恢復(fù)到執(zhí)行刪除命令之前的狀況) 而當(dāng)運(yùn)用TRUNCATE時, 回滾段不再存放任何可被恢復(fù)的信息.當(dāng)命令運(yùn)行后,數(shù)據(jù)不能被恢復(fù).因此很少的資源被調(diào)用,執(zhí)行時間也會很短. (譯者按: TRUNCATE只在刪除全表適用,TRUNCATE是DDL不是DML)
(10) 盡量多使用COMMIT:
只要有可能,在程序中盡量多使用COMMIT, 這樣程序的性能得到提高,需求也會因?yàn)?/span>COMMIT所釋放的資源而減少:
COMMIT所釋放的資源:
a. 回滾段上用于恢復(fù)數(shù)據(jù)的信息.
b. 被程序語句獲得的鎖
c. redo log buffer 中的空間
d. ORACLE為管理上述3種資源中的內(nèi)部花費(fèi)
(11) 用Where子句替換HAVING子句:
避免使用HAVING子句, HAVING 只會在檢索出所有記錄之后才對結(jié)果集進(jìn)行過濾. 這個處理需要排序,總計等操作. 如果能通過WHERE子句限制記錄的數(shù)目,那就能減少這方面的開銷. (非oracle中)on、where、having這三個都可以加條件的子句中,on是最先執(zhí)行,where次之,having最后,因?yàn)?/span>on是先把不符合條件的記錄過濾后才進(jìn)行統(tǒng)計,它就可以減少中間運(yùn)算要處理的數(shù)據(jù),按理說應(yīng)該速度是最快的,where也應(yīng)該比having快點(diǎn)的,因?yàn)樗^濾數(shù)據(jù)后才進(jìn)行sum,在兩個表聯(lián)接時才用on的,所以在一個表的時候,就剩下where跟having比較了。在這單表查詢統(tǒng)計的情況下,如果要過濾的條件沒有涉及到要計算字段,那它們的結(jié)果是一樣的,只是where可以使用rushmore技術(shù),而having就不能,在速度上后者要慢如果要涉及到計算的字段,就表示在沒計算之前,這個字段的值是不確定的,根據(jù)上篇寫的工作流程,where的作用時間是在計算之前就完成的,而having就是在計算后才起作用的,所以在這種情況下,兩者的結(jié)果會不同。在多表聯(lián)接查詢時,on比where更早起作用。系統(tǒng)首先根據(jù)各個表之間的聯(lián)接條件,把多個表合成一個臨時表后,再由where進(jìn)行過濾,然后再計算,計算完后再由having進(jìn)行過濾。由此可見,要想過濾條件起到正確的作用,首先要明白這個條件應(yīng)該在什么時候起作用,然后再決定放在那里
(12) 減少對表的查詢:
在含有子查詢的SQL語句中,要特別注意減少對表的查詢.例子:
SELECT TAB_NAME FROM TABLES WHERE (TAB_NAME,DB_VER) = ( SELECT
TAB_NAME,DB_VER FROM TAB_COLUMNS WHERE VERSION = 604)
(13) 通過內(nèi)部函數(shù)提高SQL效率.:
復(fù)雜的SQL往往犧牲了執(zhí)行效率. 能夠掌握上面的運(yùn)用函數(shù)解決問題的方法在實(shí)際工作中是非常有意義的
(14) 使用表的別名(Alias):
當(dāng)在SQL語句中連接多個表時, 請使用表的別名并把別名前綴于每個Column上.這樣一來,就可以減少解析的時間并減少那些由Column歧義引起的語法錯誤.
(15) 用EXISTS替代IN、用NOT EXISTS替代NOT IN:
在許多基于基礎(chǔ)表的查詢中,為了滿足一個條件,往往需要對另一個表進(jìn)行聯(lián)接.在這種情況下, 使用EXISTS(或NOT EXISTS)通常將提高查詢的效率. 在子查詢中,NOT IN子句將執(zhí)行一個內(nèi)部的排序和合并. 無論在哪種情況下,NOT IN都是最低效的 (因?yàn)樗鼘ψ硬樵冎械谋韴?zhí)行了一個全表遍歷). 為了避免使用NOT IN ,我們可以把它改寫成外連接(Outer Joins)或NOT EXISTS.
例子:
(高效)SELECT * FROM EMP (基礎(chǔ)表) WHERE EMPNO > 0 AND EXISTS (SELECT ‘X' FROM DEPT WHERE DEPT.DEPTNO = EMP.DEPTNO AND LOC = ‘MELB')
(低效)SELECT * FROM EMP (基礎(chǔ)表) WHERE EMPNO > 0 AND DEPTNO IN(SELECT DEPTNO FROM DEPT WHERE LOC = ‘MELB')
(16) 識別'低效執(zhí)行'的SQL語句:
雖然目前各種關(guān)于SQL優(yōu)化的圖形化工具層出不窮,但是寫出自己的SQL工具來解決問題始終是一個最好的方法:
SELECT EXECUTIONS , DISK_READS, BUFFER_GETS,
ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio,
ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run,
SQL_TEXT
FROM V$SQLAREA
WHERE EXECUTIONS>0
AND BUFFER_GETS > 0
AND (BUFFER_GETS-DISK_READS)/BUFFER_GETS < 0.8
ORDER BY 4 DESC;
(17) 用索引提高效率:
索引是表的一個概念部分,用來提高檢索數(shù)據(jù)的效率,ORACLE使用了一個復(fù)雜的自平衡B-tree結(jié)構(gòu). 通常,通過索引查詢數(shù)據(jù)比全表掃描要快. 當(dāng)ORACLE找出執(zhí)行查詢和Update語句的最佳路徑時, ORACLE優(yōu)化器將使用索引. 同樣在聯(lián)結(jié)多個表時使用索引也可以提高效率. 另一個使用索引的好處是,它提供了主鍵(primary key)的唯一性驗(yàn)證.。那些LONG或LONG RAW數(shù)據(jù)類型, 你可以索引幾乎所有的列. 通常, 在大型表中使用索引特別有效. 當(dāng)然,你也會發(fā)現(xiàn), 在掃描小表時,使用索引同樣能提高效率. 雖然使用索引能得到查詢效率的提高,但是我們也必須注意到它的代價. 索引需要空間來存儲,也需要定期維護(hù), 每當(dāng)有記錄在表中增減或索引列被修改時, 索引本身也會被修改. 這意味著每條記錄的INSERT , DELETE , UPDATE將為此多付出4 , 5 次的磁盤I/O . 因?yàn)樗饕枰~外的存儲空間和處理,那些不必要的索引反而會使查詢反應(yīng)時間變慢.。定期的重構(gòu)索引是有必要的.:
ALTER INDEX <INDEXNAME> REBUILD <TABLESPACENAME>
(18) 用EXISTS替換DISTINCT:
當(dāng)提交一個包含一對多表信息(比如部門表和雇員表)的查詢時,避免在SELECT子句中使用DISTINCT. 一般可以考慮用EXIST替換, EXISTS 使查詢更為迅速,因?yàn)?/span>RDBMS核心模塊將在子查詢的條件一旦滿足后,立刻返回結(jié)果. 例子:
(低效):
SELECT DISTINCT DEPT_NO,DEPT_NAME FROM DEPT D , EMP E
WHERE D.DEPT_NO = E.DEPT_NO
(高效):
SELECT DEPT_NO,DEPT_NAME FROM DEPT D WHERE EXISTS ( SELECT ‘X'
FROM EMP E WHERE E.DEPT_NO = D.DEPT_NO);
(19) sql語句用大寫的;因?yàn)?/span>oracle總是先解析sql語句,把小寫的字母轉(zhuǎn)換成大寫的再執(zhí)行
(20) 在java代碼中盡量少用連接符“+”連接字符串!
(21) 避免在索引列上使用NOT 通常,
我們要避免在索引列上使用NOT, NOT會產(chǎn)生在和在索引列上使用函數(shù)相同的影響. 當(dāng)ORACLE”遇到”NOT,他就會停止使用索引轉(zhuǎn)而執(zhí)行全表掃描.
(22) 避免在索引列上使用計算.
WHERE子句中,如果索引列是函數(shù)的一部分.優(yōu)化器將不使用索引而使用全表掃描.
舉例:
低效:
SELECT … FROM DEPT WHERE SAL * 12 > 25000;
高效:
SELECT … FROM DEPT WHERE SAL > 25000/12;
(23) 用>=替代>
高效:
SELECT * FROM EMP WHERE DEPTNO >=4
低效:
SELECT * FROM EMP WHERE DEPTNO >3
兩者的區(qū)別在于, 前者DBMS將直接跳到第一個DEPT等于4的記錄而后者將首先定位到DEPTNO=3的記錄并且向前掃描到第一個DEPT大于3的記錄.
(24) 用UNION替換OR (適用于索引列)
通常情況下, 用UNION替換WHERE子句中的OR將會起到較好的效果. 對索引列使用OR將造成全表掃描. 注意, 以上規(guī)則只針對多個索引列有效. 如果有column沒有被索引, 查詢效率可能會因?yàn)槟銢]有選擇OR而降低. 在下面的例子中, LOC_ID 和REGION上都建有索引.
高效:
SELECT LOC_ID , LOC_DESC , REGION
FROM LOCATION
WHERE LOC_ID = 10
UNION
SELECT LOC_ID , LOC_DESC , REGION
FROM LOCATION
WHERE REGION = “MELBOURNE”
低效:
SELECT LOC_ID , LOC_DESC , REGION
FROM LOCATION
WHERE LOC_ID = 10 OR REGION = “MELBOURNE”
如果你堅持要用OR, 那就需要返回記錄最少的索引列寫在最前面.
(25) 用IN來替換OR
這是一條簡單易記的規(guī)則,但是實(shí)際的執(zhí)行效果還須檢驗(yàn),在ORACLE8i下,兩者的執(zhí)行路徑似乎是相同的.
低效:
SELECT…. FROM LOCATION WHERE LOC_ID = 10 OR LOC_ID = 20 OR LOC_ID = 30
高效
SELECT… FROM LOCATION WHERE LOC_IN IN (10,20,30);
(26) 避免在索引列上使用IS NULL和IS NOT NULL
避免在索引中使用任何可以為空的列,ORACLE將無法使用該索引.對于單列索引,如果列包含空值,索引中將不存在此記錄. 對于復(fù)合索引,如果每個列都為空,索引中同樣不存在此記錄. 如果至少有一個列不為空,則記錄存在于索引中.舉例: 如果唯一性索引建立在表的A列和B列上, 并且表中存在一條記錄的A,B值為(123,null) , ORACLE將不接受下一條具有相同A,B值(123,null)的記錄(插入). 然而如果所有的索引列都為空,ORACLE將認(rèn)為整個鍵值為空而空不等于空. 因此你可以插入1000 條具有相同鍵值的記錄,當(dāng)然它們都是空! 因?yàn)榭罩挡淮嬖谟谒饕兄?/span>,所以WHERE子句中對索引列進(jìn)行空值比較將使ORACLE停用該索引.
低效: (索引失效)
SELECT … FROM DEPARTMENT WHERE DEPT_CODE IS NOT NULL;
高效: (索引有效)
SELECT … FROM DEPARTMENT WHERE DEPT_CODE >=0;
(27) 總是使用索引的第一個列:
如果索引是建立在多個列上, 只有在它的第一個列(leading column)被where子句引用時,優(yōu)化器才會選擇使用該索引. 這也是一條簡單而重要的規(guī)則,當(dāng)僅引用索引的第二個列時,優(yōu)化器使用了全表掃描而忽略了索引
(28) 用UNION-ALL 替換UNION ( 如果有可能的話):
當(dāng)SQL 語句需要UNION兩個查詢結(jié)果集合時,這兩個結(jié)果集合會以UNION-ALL的方式被合并, 然后在輸出最終結(jié)果前進(jìn)行排序. 如果用UNION ALL替代UNION, 這樣排序就不是必要了. 效率就會因此得到提高. 需要注意的是,UNION ALL 將重復(fù)輸出兩個結(jié)果集合中相同記錄. 因此各位還是要從業(yè)務(wù)需求分析使用UNION ALL的可行性. UNION 將對結(jié)果集合排序,這個操作會使用到SORT_AREA_SIZE這塊內(nèi)存. 對于這塊內(nèi)存的優(yōu)化也是相當(dāng)重要的. 下面的SQL可以用來查詢排序的消耗量
低效:
SELECT ACCT_NUM, BALANCE_AMT
FROM DEBIT_TRANSACTIONS
WHERE TRAN_DATE = '31-DEC-95'
UNION
SELECT ACCT_NUM, BALANCE_AMT
FROM DEBIT_TRANSACTIONS
WHERE TRAN_DATE = '31-DEC-95'
高效:
SELECT ACCT_NUM, BALANCE_AMT
FROM DEBIT_TRANSACTIONS
WHERE TRAN_DATE = '31-DEC-95'
UNION ALL
SELECT ACCT_NUM, BALANCE_AMT
FROM DEBIT_TRANSACTIONS
WHERE TRAN_DATE = '31-DEC-95'
(29) 用WHERE替代ORDER BY:
ORDER BY 子句只在兩種嚴(yán)格的條件下使用索引.
ORDER BY中所有的列必須包含在相同的索引中并保持在索引中的排列順序.
ORDER BY中所有的列必須定義為非空.
WHERE子句使用的索引和ORDER BY子句中所使用的索引不能并列.
例如:
表DEPT包含以下列:
DEPT_CODE PK NOT NULL
DEPT_DESC NOT NULL
DEPT_TYPE NULL
低效: (索引不被使用)
SELECT DEPT_CODE FROM DEPT ORDER BY DEPT_TYPE
高效: (使用索引)
SELECT DEPT_CODE FROM DEPT WHERE DEPT_TYPE > 0
(30) 避免改變索引列的類型.:
當(dāng)比較不同數(shù)據(jù)類型的數(shù)據(jù)時, ORACLE自動對列進(jìn)行簡單的類型轉(zhuǎn)換.
假設(shè) EMPNO是一個數(shù)值類型的索引列.
SELECT … FROM EMP WHERE EMPNO = ‘123'
實(shí)際上,經(jīng)過ORACLE類型轉(zhuǎn)換, 語句轉(zhuǎn)化為:
SELECT … FROM EMP WHERE EMPNO = TO_NUMBER(‘123')
幸運(yùn)的是,類型轉(zhuǎn)換沒有發(fā)生在索引列上,索引的用途沒有被改變.
現(xiàn)在,假設(shè)EMP_TYPE是一個字符類型的索引列.
SELECT … FROM EMP WHERE EMP_TYPE = 123
這個語句被ORACLE轉(zhuǎn)換為:
SELECT … FROM EMP WHERETO_NUMBER(EMP_TYPE)=123
因?yàn)閮?nèi)部發(fā)生的類型轉(zhuǎn)換, 這個索引將不會被用到! 為了避免ORACLE對你的SQL進(jìn)行隱式的類型轉(zhuǎn)換, 最好把類型轉(zhuǎn)換用顯式表現(xiàn)出來. 注意當(dāng)字符和數(shù)值比較時, ORACLE會優(yōu)先轉(zhuǎn)換數(shù)值類型到字符類型
(31) 需要當(dāng)心的WHERE子句:
某些SELECT 語句中的WHERE子句不使用索引. 這里有一些例子.
在下面的例子里, (1)‘!=' 將不使用索引. 記住, 索引只能告訴你什么存在于表中, 而不能告訴你什么不存在于表中. (2) ‘||'是字符連接函數(shù). 就象其他函數(shù)那樣, 停用了索引. (3) ‘+'是數(shù)學(xué)函數(shù). 就象其他數(shù)學(xué)函數(shù)那樣, 停用了索引. (4)相同的索引列不能互相比較,這將會啟用全表掃描.
(32) a. 如果檢索數(shù)據(jù)量超過30%的表中記錄數(shù).使用索引將沒有顯著的效率提高.
b. 在特定情況下, 使用索引也許會比全表掃描慢, 但這是同一個數(shù)量級上的區(qū)別. 而通常情況下,使用索引比全表掃描要塊幾倍乃至幾千倍!
(33) 避免使用耗費(fèi)資源的操作:
帶有DISTINCT,UNION,MINUS,INTERSECT,ORDER BY的SQL語句會啟動SQL引擎
執(zhí)行耗費(fèi)資源的排序(SORT)功能. DISTINCT需要一次排序操作, 而其他的至少需要執(zhí)行兩次排序. 通常, 帶有UNION, MINUS , INTERSECT的SQL語句都可以用其他方式重寫. 如果你的數(shù)據(jù)庫的SORT_AREA_SIZE調(diào)配得好, 使用UNION , MINUS, INTERSECT也是可以考慮的, 畢竟它們的可讀性很強(qiáng)
(34) 優(yōu)化GROUP BY:
提高GROUP BY 語句的效率, 可以通過將不需要的記錄在GROUP BY 之前過濾掉.下面兩個查詢返回相同結(jié)果但第二個明顯就快了許多.
低效:
SELECT JOB , AVG(SAL)
FROM EMP
GROUP JOB
HAVING JOB = ‘PRESIDENT'
OR JOB = ‘MANAGER'
高效:
SELECT JOB , AVG(SAL)
FROM EMP
WHERE JOB = ‘PRESIDENT'
OR JOB = ‘MANAGER'
GROUP JOB
問題一
如果你家附近有一家餐廳,東西又貴又難吃,桌上還爬著蟑螂,你會因?yàn)樗芙芊奖悖鸵欢佟⒃俣毓馀R嗎?
回答:你一定會說,這是什么爛問題,誰那么笨,花錢買罪受?
可同樣的情況換個場合,自己或許就做類似的蠢事。不少男女都曾經(jīng)抱怨過他們的情人或配偶品性不端,三心二意,不負(fù)責(zé)任。明知在一起沒什么好的結(jié)果,怨恨已經(jīng)比愛還多,但卻“不知道為什么”還是要和他攪和下去,分不了手。說穿了,只是為了不甘,為了習(xí)慣,這不也和光臨餐廳一樣?
――做人,為什么要過于執(zhí)著?!
問題二
如果你不小心丟掉100塊錢,只知道它好像丟在某個你走過的地方,你會花200塊錢的車費(fèi)去把那100塊找回來嗎?
回答:一個超級愚蠢的問題。
可是,相似的事情卻在人生中不斷發(fā)生。做錯了一件事,明知自己有問題,卻死也不肯認(rèn)錯,反而花加倍的時間來找藉口,讓別人對自己的印象大打折扣。被人罵了一句話,卻花了無數(shù)時間難過,道理相同。為一件事情發(fā)火,不惜損人不利已,不惜血本,不惜時間,只為報復(fù),不也一樣無聊?
失去一個人的感情,明知一切已無法挽回,卻還是那么傷心,而且一傷心就是好幾年,還要借酒澆愁,形銷骨立。其實(shí)這樣一點(diǎn)用也沒有,只是損失更多。
――做人,干嗎為難自己?!
問題三
你會因?yàn)榇蜷_報紙發(fā)現(xiàn)每天都有車禍,就不敢出門嗎?
回答:這是個什么爛問題?當(dāng)然不會,那叫因噎廢食。
然而,有不少人卻曾說:現(xiàn)在的離婚率那么高,讓我都不敢談戀愛了。說得還挺理所當(dāng)然。也有不少女人看到有關(guān)的諸多報道,就對自己的另一半憂心忡忡,這不也是類似的反應(yīng)?
所謂樂觀,就是得相信:雖然道路多艱險,我還是那個會平安過馬路的人,只要我小心一點(diǎn),不必害怕過馬路。
――做人,先要相信自己。
問題四
你相信每個人隨便都可以成功立業(yè)嗎?
回答:當(dāng)然不會相信。
但據(jù)觀察,有人總是在聽完成功人士絞盡腦汁的建議,比如說,多讀書,多練習(xí)之后,問了另一個問題?那不是很難?
我們都想在3分鐘內(nèi)學(xué)好英文,在5分鐘內(nèi)解決所有難題,難道成功是那么容易的嗎?改變當(dāng)然是難的。成功只因不怕困難,所以才能出類拔萃。
有一次坐在出租車上,聽見司機(jī)看到自己前后都是高檔車,兀自感嘆:“唉,為什么別人那么有錢,我的錢這么難賺?” 我心血來潮,問他:“你認(rèn)為世上有什么錢是好賺的?”他答不出來,過了半晌才說:好像都是別人的錢比較好賺。
其實(shí)任何一個成功者都是艱辛取得。我們實(shí)在不該抱怨命運(yùn)。
――做人,依靠自己!
問題五
你認(rèn)為完全沒有打過籃球的人,可以當(dāng)很好的籃球教練嗎?
回答:當(dāng)然不可能,外行不可能領(lǐng)導(dǎo)內(nèi)行。
可是,有許多人,對某個行業(yè)完全不了解,只聽到那個行業(yè)好賺錢,就馬上開起業(yè)來了。
我看過對穿著沒有任何口味、或根本不在乎穿著的人,夢想?yún)s是開間服裝店;不知道電腦怎么開機(jī)的人,卻想在網(wǎng)上賺錢,結(jié)果道聽途說,卻不反省自己是否專業(yè)能力不足,只抱怨時不我與。
――做人,量力而行。
問題六
相似但不相同的問題:你是否認(rèn)為,籃球教練不上籃球場,閉著眼睛也可以主導(dǎo)一場完美的利?
回答:有病啊,當(dāng)然是不可能的。
可是卻有不少朋友,自己沒有時間打理,卻拼命投資去開咖啡館,開餐廳,開自己根本不懂的公司,火燒一樣急著把辛苦積攢的積蓄花掉,去當(dāng)一個稀里糊涂的投資人。虧的總是比賺的多,卻覺得自己是因?yàn)檫\(yùn)氣不好,而不是想法出了問題。
――做人,記得反省自己。
問題七
你寧可永遠(yuǎn)后悔,也不愿意試一試自己能否轉(zhuǎn)敗為勝?
解答:恐怕沒有人會說:“對,我就是這樣的孬種”吧。
然而,我們卻常常在不該打退堂鼓時拼命打退堂鼓,為了恐懼失敗而不敢嘗試成功。
以關(guān)穎珊贏得2000年世界花樣滑冰冠軍時的精彩表現(xiàn)為例:她一心想贏得第一名,然而在最后一場比賽前,她的總積分只排名第三位,在最后的自選曲項(xiàng)目上,她選擇了突破,而不是少出錯。在4分鐘的長曲中,結(jié)合了最高難度的三周跳,并且還大膽地連跳了兩次。她也可能會敗得很難看,但是她畢竟成功了。
她說:“因?yàn)槲也幌氲鹊绞。藕蠡谧约哼€有潛力沒發(fā)揮。”
一個中國偉人曾說;勝利的希望和有利情況的恢復(fù),往往產(chǎn)生于再堅持一下的努力之中。
――做人,何妨放手一搏。
問題八
你的時間無限,長生不老,所以最想做的事,應(yīng)該無限延期?
回答:不,傻瓜才會這樣認(rèn)為。
然而我們卻常說,等我老了,要去環(huán)游世界;等我退休,就要去做想做的事情;等孩子長大了,我就可以……
我們都以為自己有無限的時間與精力。其實(shí)我們可以一步一步實(shí)現(xiàn)理想,不必在等待中徒耗生命。如果現(xiàn)在就能一步一步努力接近,我們就不會活了半生,卻出現(xiàn)自己最不想看到的結(jié)局。
――做人,要活在當(dāng)下。
做為一名大四的學(xué)生,我面試過不少的單位,有成功的也有失敗的,但是對我來說所有的失敗在某種意義上都是一種成功,特別是我下面寫的這些,寫這篇文章的時候,我已經(jīng)簽了南京的一家軟件公司,但是想起今年2月21日我面試蘇州TW的IT公司的經(jīng)歷聯(lián)想到我們現(xiàn)在學(xué)習(xí)編程的一些情況我真的深有感觸,這次面試使我深深的體會到了失敗但也收獲了很多。我要說的將分成三部分,1.是我面試的具體經(jīng)過2.是由面試想到的3.現(xiàn)今我應(yīng)該做的。當(dāng)然這些話很大程度上是我個人的意見,不可能完全得到大家的贊同,所以在某些觀點(diǎn)上如果哪位朋友覺得跟我的有很大出入,請不要介意,也不要對我攻擊,就當(dāng)我沒有說過,歡迎和我聯(lián)系共同探討這些問題!我的E-Mail:fvifnmmmm@126.com
1.面試經(jīng)過
大約在年前我接到了TW瑞晟(Realtek)蘇州公司的面試通知,通知我2月21日到蘇州工業(yè)園區(qū)面試,接到面試后的幾天我把一些專業(yè)課溫習(xí)了一遍,特別是C++和數(shù)據(jù)結(jié)構(gòu),由于大學(xué)幾年里,我一直專研這些方面,加上通過了高級程序員的考試,對于一些常用的算法我差不多也達(dá)到了爛熟于胸的地步,當(dāng)時的感覺是如果問了我這些方面的問題我應(yīng)該是沒有問題的!
21日那天我被安排在4:30面試,由一位技術(shù)人員單獨(dú)給我面試,在問了一些簡單的問題之后他給我出了一道編程題目,題目是這樣的:
(由于具體面試的題目比較煩瑣,我將其核心思想提取出來分解成了兩個獨(dú)立的簡單的問題,有可能問題分解的不當(dāng),請大家見諒,實(shí)際面試了一個的問題但比其復(fù)雜很多,而且涉及一些高等數(shù)學(xué)變換)
1) 寫一個函數(shù)計算當(dāng)參數(shù)為n(n很大)時的值 1-2+3-4+5-6+7......+n
哼,我的心里冷笑一聲!沒想到這么簡單,我有點(diǎn)緊張的心情頓時放松起來!
于是很快我給出我的解法:
long fn(long n)
{
long temp=0;
int i,flag=1;
if(n<=0)
{
printf("error: n must > 0);
exit(1);
}
for(i=1;i<=n;i++)
{
temp=temp+flag*i;
flag=(-1)*flag;
}
return temp;
}
搞定!當(dāng)我用期待的目光看著面試官的時候,他微笑著跟我說,執(zhí)行結(jié)果肯定是沒有問題!但當(dāng)n很大的時候我這個程序執(zhí)行效率很低, 在嵌入式系統(tǒng)的開發(fā)中,程序的運(yùn)行效率很重要,能讓CPU少執(zhí)行一條指令都是好的,他讓我看看這個程序還有什么可以修改的地方,把程序優(yōu)化一下!聽了這些話,我的心情當(dāng)時變的有點(diǎn)沉重,沒想到他的要求很嚴(yán)格,之后我對程序進(jìn)行了嚴(yán)格的分析,給出了改進(jìn)了的方案!
long fn(long n)
{
long temp=0;
int j=1,i=1,flag=1;
if(n<=0)
{
printf("error: n must > 0);
exit(1);
}
while(j<=n)
{
temp=temp+i;
i=-i;
i>0?i++:i--;
j++;
}
return temp;
}
雖然我不敢保證我這個算法是最優(yōu)的,但是比起上一個程序,我將所有涉及到乘法指令的語句改為執(zhí)行加法指令,既達(dá)到要題目的要求而且運(yùn)算時間上縮短了很多!而代價僅僅是增加了一個整型變量!但是我現(xiàn)在的信心已經(jīng)受了一點(diǎn)打擊,我將信將疑的看者面試官,他還是微笑著跟我說:“不錯,這個程序確實(shí)在效率上有的很大的提高!”我心里一陣暗喜!但他接著說這個程序仍然不能達(dá)到他的要求,要我給出更優(yōu)的方案!天啊!還有優(yōu)化!我當(dāng)時真的有點(diǎn)崩潰了,想了一會后,我請求他給出他的方案!然后他很爽快的給出了他的程序!
long fn(long n)
{
if(n<=0)
{
printf("error: n must > 0);
exit(1);
}
if(0==n%2)
return (n/2)*(-1);
else
return (n/2)*(-1)+n;
}
搞笑,當(dāng)時我目瞪口呆,沒想到他是這個意思,這么簡單的代碼我真的不會寫嗎,但是我為什么沒有往那方面上想呢!他說的沒有錯,在n很大很大的時候這三個程序運(yùn)行時間的差別簡直是天壤之別!當(dāng)我剛想開口說點(diǎn)什么的時候,他卻先開口了:“不要認(rèn)為CPU運(yùn)算速度快就把所有的問題都推給它去做,程序員應(yīng)該將代碼優(yōu)化再優(yōu)化,我們自己能做的決不要讓CPU做,因?yàn)镃PU是為用戶服務(wù)的,不是為我們程序員服務(wù)的!”多么精辟的語言,我已經(jīng)不想再說什么了!接著是第二個問題:
2),他要求我用一種技巧性的編程方法來用一個函數(shù)實(shí)現(xiàn)兩個函數(shù)的功能n為如:
fn1(n)=n/2!+n/3!+n/4!+n/5!+n/6!
fn2(n)=n/5!+n/6!+n/7!+n/8!+n/9!
現(xiàn)在用一個函數(shù)fn(int n,int flag)實(shí)現(xiàn),當(dāng)flag為0時,實(shí)現(xiàn)fn1功能,如果flag為1時實(shí)現(xiàn)fn2功能!
他的要求還是效率,效率,效率!說實(shí)在話,如果我心情好的話我應(yīng)該能給出一種比較好的算法,但我那時真的沒有什么心思再想了,我在紙上胡亂畫了一些諸如6!=6*5!的公式后直截了當(dāng)?shù)母f要他給出他的答案!面試官也沒有說什么,給出了他的思路:
定義一個二維數(shù)組 float t[2][5]存入[2!,3!,4!,5!,6!},{5!,6!,7!,8!,9!]然后給出一個循環(huán):
for(i=0;i<6;i++)
{
temp=temp+n/t[flag];
}
最后得到計算值!呵呵,典型的空間換時間的算法!
這些總共花了50分鐘的時間,還有十分鐘我就跟他很隨意的聊聊天,聊了一些編程以及生活的問題,那時的我已經(jīng)很放松了,因?yàn)槲抑肋@次面試結(jié)果只有一個:失敗。5:30的時候面試官要我等通知,于是我離開了他們公司。這就是面試的整個經(jīng)過!
.由面試想到的
真的是很失敗啊!我記得那天下好大的雨,氣溫也很低,我邊走邊想,從5:30一直走到7:30,全身都濕透了,又冷又餓,但是我只是一直走,腦子里面充滿了疑惑,我也想讓雨把自己淋醒!看到這里有些朋友可能覺得那些面試題目不算什么如果讓自己做的話肯定能全部答對,我肯定相信你,因?yàn)槲覐奈磻岩蛇^中國程序員的能力,我認(rèn)為中國有世界上最好的程序員,我也從未認(rèn)為自己是高手,所以我做不出來不代表中國程序員比TW或者別的地方的程序員差,所以我就從我的角度,我的所見所想來談一些感想:
不錯全世界都有優(yōu)秀的程序員,中國也不例外,但是我疑惑的是:到底中國和TW或者國外的優(yōu)秀的程序員的比例到底是多少?TW我不知道,中國100個程序員里有幾個是優(yōu)秀的呢?我根本算不上,從上面的表現(xiàn)就足以說明一切了!是1個?5個?10個?50個?這個數(shù)字我不敢亂猜,恐遭網(wǎng)友一頓痛罵,那么我們國內(nèi)有多少人學(xué)習(xí)計算機(jī)呢?拿我們學(xué)校來說,計算機(jī)97級4個班,98級5個班,99級10個班,2000級17個班,人多了,老師怎么辦?我們學(xué)校的做法是讓研究生上課,然后呢?補(bǔ)考一抓一大把,大把大把的補(bǔ)考費(fèi)落入了學(xué)校的口袋,還說現(xiàn)在的學(xué)生素質(zhì)低!真是好笑,我都不知道學(xué)校這么做是為了什么,為國內(nèi)培養(yǎng)大量的程序員嗎?學(xué)生們能真正學(xué)到計算機(jī)知識嗎?好了,我敢講,在我們學(xué)校學(xué)習(xí)編程學(xué)生和優(yōu)秀程序員(注意我指的是優(yōu)秀,只會編幾個糟爛程序的人算不上)的比例應(yīng)該是100:0.1 。在這種比例下雖然我們中國學(xué)習(xí)編程的人鋪天蓋地,但是想想有多少個人能真正為中國軟件業(yè)發(fā)展作出貢獻(xiàn),有多少人能真正寫出優(yōu)秀的程序名揚(yáng)海外!
我從學(xué)習(xí)編程以來,不管是自學(xué)還是老師指導(dǎo),從來都是解決問題就好,編出程序來就行,我的疑惑是:我們有真正的強(qiáng)調(diào)過程序的效率,程序的質(zhì)量嗎?我們有仔細(xì)分析過我們寫的東西,看看有沒有可以改進(jìn)的地方,看看有沒有簡單的方法來達(dá)到同樣的目的呢?我問心自問,我發(fā)現(xiàn),我從來沒有對我寫出來的程序進(jìn)行過優(yōu)化,最多就是進(jìn)行詳細(xì)的測試,然后Debug,但是這就足夠了嗎?這些天我偶爾發(fā)現(xiàn)我曾經(jīng)寫過的一個游戲,那是一年前我剛加入www.vcroad.net做為其中一員時候,感覺應(yīng)該拿點(diǎn)東西出來,然后花了一個星期的時間寫出來的!程序不算復(fù)雜,但是用到了不少數(shù)據(jù)結(jié)構(gòu)的東西,也用到了一些精彩的算法,加上windows的界面和游戲的可玩性,寫完后受到了不少好評,我當(dāng)時真的很佩服自己!但是現(xiàn)在看呢:沒有一句注釋,好多丑陋的函數(shù)名比如:void chushihua(),好多沒有必要的變量,可以用簡單語句完成工作的我使用華麗的算法,大量使用全局變量.....,說不好聽的話,六百多行的程序除了能運(yùn)行之外就是一陀屎!如果一年前我能聽到一些反面意見的話,大概我能早一點(diǎn)覺悟,但是自從原代碼在網(wǎng)站發(fā)布以來聽到的都是贊美之詞,沒有一個人向我提出程序改進(jìn)的意見,這又說明了一個什么問題呢?很值得思考啊!
還有一個疑惑是:我們說的和做的真的一樣嗎?我在學(xué)校的時候曾經(jīng)受學(xué)院指派承辦過一個計算機(jī)大賽,請了一個老師出決賽的題目,主要是一些算法題目,這個老師可能是我上大學(xué)以來唯一敬佩的老師了,從程序調(diào)試到打分,對于每個程序都仔細(xì)分析其時間效率和空間效率,然后綜合打分,四十個人的卷子,老師從下午三點(diǎn)一直調(diào)試到晚上十點(diǎn),在有些寫的精彩的語句后還加上批注。我真是高興很遇到這樣的老師并且和他做深入的交流,但在事后,卻發(fā)生了一件不愉快的事,在比賽中獲得第二名的學(xué)生找到我,說他程序全部調(diào)試成功應(yīng)該給他滿分,并且應(yīng)該得第一,我說不過他,最后調(diào)出了他的原程序和第一名的原程序?qū)Ρ龋诲e,兩個程序都運(yùn)行的很好,這時,那個同學(xué)開口了:“我的程序?qū)懙氖趾喗菝髁耍瑑H僅數(shù)行就完成了題目要求,而他的卻寫了一大堆,為什么給他的分多過給我的分。”我當(dāng)時很是氣憤,如果不是老師負(fù)責(zé)的話,那么現(xiàn)在第一名和第二名的位置真的要互調(diào)了,拜托,不是程序的行數(shù)越少程序的質(zhì)量就越高,我記得我跟他大談這方面的道理,最后說服他了!哈哈,但是我,只能說說而已,我不知道還有多少人一樣,說起來頭頭是道,但心里卻壓根就從未重視過它!
.我打算做的!
其實(shí)那天我想到的遠(yuǎn)不止上面那么多,但是我不想再說了,因?yàn)槲也孪肟催@篇文章的網(wǎng)友大概都有一肚子的感想,一肚子的抱怨,借用這篇文章發(fā)泄可不是我想達(dá)到的目的,在上面我把自己罵的一文不值也不是妄自菲薄,但是在某些方面我真的做錯了,或者說是偏離了正確方向,現(xiàn)在是矯正方向和重整旗鼓的時候了,就象我前面說過的,我相信中國有世界上最好的程序員,我也相信我的水平不會一直保持現(xiàn)狀,我現(xiàn)在就收拾起牢騷真正的實(shí)干起來!
真的很巧,就寫到這里的時候我在網(wǎng)上偶爾發(fā)現(xiàn)了這篇手冊,我不知道這預(yù)示著什么,但是我想如果我照下面這個基本原則一直踏實(shí)做下去,我一定會實(shí)現(xiàn)我的理想---一名優(yōu)秀的軟件設(shè)計師!
(下面這些文字不是我的原創(chuàng),是我偶爾在網(wǎng)上發(fā)現(xiàn)的,我真的很幸運(yùn)能看到這些,這篇文章也隨著下面的文字而結(jié)束,我真心的希望您能從這篇文章中得到啟發(fā),這篇文章歡迎大家隨意轉(zhuǎn)載,您可以不寫作者是誰,但是請您寫上www.vcroad.net原創(chuàng),謝謝您的支持)
作者:金蝶中間件公司CTO袁紅崗
不知不覺做軟件已經(jīng)做了十年,有成功的喜悅,也有失敗的痛苦,但總不敢稱自己是高手,因?yàn)楹臀倚哪恐姓嬲母呤謧儽绕饋恚€差的太遠(yuǎn)。世界上并沒有成為高手的捷徑,但一些基本原則是可以遵循的。
1. 扎實(shí)的基礎(chǔ)。數(shù)據(jù)結(jié)構(gòu)、離散數(shù)學(xué)、編譯原理,這些是所有計算機(jī)科學(xué)的基礎(chǔ),如果不掌握他們,很難寫出高水平的程序。據(jù)我的觀察,學(xué)計算機(jī)專業(yè)的人比學(xué)其他專業(yè)的人更能寫出高質(zhì)量的軟件。程序人人都會寫,但當(dāng)你發(fā)現(xiàn)寫到一定程度很難再提高的時候,就應(yīng)該想想是不是要回過頭來學(xué)學(xué)這些最基本的理論。不要一開始就去學(xué)OOP,即使你再精通OOP,遇到一些基本算法的時候可能也會束手無策。
2. 豐富的想象力。不要拘泥于固定的思維方式,遇到問題的時候要多想幾種解決問題的方案,試試別人從沒想過的方法。豐富的想象力是建立在豐富的知識的基礎(chǔ)上,除計算機(jī)以外,多涉獵其他的學(xué)科,比如天文、物理、數(shù)學(xué)等等。另外,多看科幻電影也是一個很好的途徑。
3. 最簡單的是最好的。這也許是所有科學(xué)都遵循的一條準(zhǔn)則,如此復(fù)雜的質(zhì)能互換原理在愛因斯坦眼里不過是一個簡單得不能再簡單的公式:E=mc2。簡單的方法更容易被人理解,更容易實(shí)現(xiàn),也更容易維護(hù)。遇到問題時要優(yōu)先考慮最簡單的方案,只有簡單方案不能滿足要求時再考慮復(fù)雜的方案。
4. 不鉆牛角尖。當(dāng)你遇到障礙的時候,不妨?xí)簳r遠(yuǎn)離電腦,看看窗外的風(fēng)景,聽聽輕音樂,和朋友聊聊天。當(dāng)我遇到難題的時候會去玩游戲,而且是那種極暴力的打斗類游戲,當(dāng)負(fù)責(zé)游戲的那部分大腦細(xì)胞極度亢奮的時候,負(fù)責(zé)編程的那部分大腦細(xì)胞就得到了充分的休息。當(dāng)重新開始工作的時候,我會發(fā)現(xiàn)那些難題現(xiàn)在竟然可以迎刃而解。
5. 對答案的渴求。人類自然科學(xué)的發(fā)展史就是一個渴求得到答案的過程,即使只能知道答案的一小部分也值得我們?nèi)ジ冻觥V灰銏远ㄐ拍睿欢ㄒ业絾栴}的答案,你才會付出精力去探索,即使最后沒有得到答案,在過程中你也會學(xué)到很多東西。
6. 多與別人交流。三人行必有我?guī)煟苍S在一次和別人不經(jīng)意的談話中,就可以迸出靈感的火花。多上上網(wǎng),看看別人對同一問題的看法,會給你很大的啟發(fā)。
7. 良好的編程風(fēng)格。注意養(yǎng)成良好的習(xí)慣,代碼的縮進(jìn)編排,變量的命名規(guī)則要始終保持一致。大家都知道如何排除代碼中錯誤,卻往往忽視了對注釋的排錯。注釋是程序的一個重要組成部分,它可以使你的代碼更容易理解,而如果代碼已經(jīng)清楚地表達(dá)了你的思想,就不必再加注釋了,如果注釋和代碼不一致,那就更加糟糕。
8. 韌性和毅力。這也許是"高手"和一般程序員最大的區(qū)別。A good programming is 99 weat and 1?ffee。高手們并不是天才,他們是在無數(shù)個日日夜夜中磨練出來的。成功能給我們帶來無比的喜悅,但過程卻是無比的枯燥乏味。你不妨做個測試,找個10000以內(nèi)的素數(shù)表,把它們?nèi)汲聛恚缓笤贆z查三遍,如果能夠不間斷地完成這一工作,你就可以滿足這一條。
一、引言
Java虛擬機(jī)(JVM)的類裝載就是指將包含在類文件中的字節(jié)碼裝載到JVM中, 并使其成為JVM一部分的過程。JVM的類動態(tài)裝載技術(shù)能夠在運(yùn)行時刻動態(tài)地加載或者替換系統(tǒng)的某些功能模塊, 而不影響系統(tǒng)其他功能模塊的正常運(yùn)行。本文將分析JVM中的類裝載系統(tǒng),探討JVM中類裝載的原理、實(shí)現(xiàn)以及應(yīng)用。
二、Java虛擬機(jī)的類裝載實(shí)現(xiàn)與應(yīng)用
2.1 裝載過程簡介
所謂裝載就是尋找一個類或是一個接口的二進(jìn)制形式并用該二進(jìn)制形式來構(gòu)造代表這個類或是這個接口的class對象的過程,其中類或接口的名稱是給定了的。當(dāng)然名稱也可以通過計算得到,但是更常見的是通過搜索源代碼經(jīng)過編譯器編譯后所得到的二進(jìn)制形式來構(gòu)造。
在Java中,類裝載器把一個類裝入Java虛擬機(jī)中,要經(jīng)過三個步驟來完成:裝載、鏈接和初始化,其中鏈接又可以分成校驗(yàn)、準(zhǔn)備和解析三步,除了解析外,其它步驟是嚴(yán)格按照順序完成的,各個步驟的主要工作如下:
裝載:查找和導(dǎo)入類或接口的二進(jìn)制數(shù)據(jù);
鏈接:執(zhí)行下面的校驗(yàn)、準(zhǔn)備和解析步驟,其中解析步驟是可以選擇的;
校驗(yàn):檢查導(dǎo)入類或接口的二進(jìn)制數(shù)據(jù)的正確性;
準(zhǔn)備:給類的靜態(tài)變量分配并初始化存儲空間;
解析:將符號引用轉(zhuǎn)成直接引用;
初始化:激活類的靜態(tài)變量的初始化Java代碼和靜態(tài)Java代碼塊。
至于在類裝載和虛擬機(jī)啟動的過程中的具體細(xì)節(jié)和可能會拋出的錯誤,請參看《Java虛擬機(jī)規(guī)范》以及《深入Java虛擬機(jī)》,它們在網(wǎng)絡(luò)上面的資源地址是:
http://java.sun.com/docs/books/vmspec/2nd-edition/html/Preface.doc.html
http://www.artima.com/insidejvm/ed2/index.html
由于本文的討論重點(diǎn)不在此就不再多敘述。
2.2 裝載的實(shí)現(xiàn)
JVM中類的裝載是由ClassLoader和它的子類來實(shí)現(xiàn)的,Java ClassLoader 是一個重要的Java運(yùn)行時系統(tǒng)組件。它負(fù)責(zé)在運(yùn)行時查找和裝入類文件的類。
在Java中,ClassLoader是一個抽象類,它在包java.lang中,可以這樣說,只要了解了在ClassLoader中的一些重要的方法,再結(jié)合上面所介紹的JVM中類裝載的具體的過程,對動態(tài)裝載類這項(xiàng)技術(shù)就有了一個比較大概的掌握,這些重要的方法包括以下幾個:
①loadCass方法 loadClass(String name ,boolean resolve)其中name參數(shù)指定了JVM需要的類的名稱,該名稱以包表示法表示,如Java.lang.Object;resolve參數(shù)告訴方法是否需要解析類,在初始化類之前,應(yīng)考慮類解析,并不是所有的類都需要解析,如果JVM只需要知道該類是否存在或找出該類的超類,那么就不需要解析。這個方法是ClassLoader 的入口點(diǎn)。
②defineClass方法 這個方法接受類文件的字節(jié)數(shù)組并把它轉(zhuǎn)換成Class對象。字節(jié)數(shù)組可以是從本地文件系統(tǒng)或網(wǎng)絡(luò)裝入的數(shù)據(jù)。它把字節(jié)碼分析成運(yùn)行時數(shù)據(jù)結(jié)構(gòu)、校驗(yàn)有效性等等。
③findSystemClass方法 findSystemClass方法從本地文件系統(tǒng)裝入文件。它在本地文件系統(tǒng)中尋找類文件,如果存在,就使用defineClass將字節(jié)數(shù)組轉(zhuǎn)換成Class對象,以將該文件轉(zhuǎn)換成類。當(dāng)運(yùn)行Java應(yīng)用程序時,這是JVM 正常裝入類的缺省機(jī)制。
④resolveClass方法 resolveClass(Class c)方法解析裝入的類,如果該類已經(jīng)被解析過那么將不做處理。當(dāng)調(diào)用loadClass方法時,通過它的resolve 參數(shù)決定是否要進(jìn)行解析。
⑤findLoadedClass方法 當(dāng)調(diào)用loadClass方法裝入類時,調(diào)用findLoadedClass 方法來查看ClassLoader是否已裝入這個類,如果已裝入,那么返回Class對象,否則返回NULL。如果強(qiáng)行裝載已存在的類,將會拋出鏈接錯誤。
2.3 裝載的應(yīng)用
一般來說,我們使用虛擬機(jī)的類裝載時需要繼承抽象類java.lang.ClassLoader,其中必須實(shí)現(xiàn)的方法是loadClass(),對于這個方法需要實(shí)現(xiàn)如下操作:(1) 確認(rèn)類的名稱;(2) 檢查請求要裝載的類是否已經(jīng)被裝載;(3) 檢查請求加載的類是否是系統(tǒng)類;(4) 嘗試從類裝載器的存儲區(qū)獲取所請求的類;(5) 在虛擬機(jī)中定義所請求的類;(6) 解析所請求的類;(7) 返回所請求的類。
所有的Java 虛擬機(jī)都包括一個內(nèi)置的類裝載器,這個內(nèi)置的類庫裝載器被稱為根裝載器(bootstrap ClassLoader)。根裝載器的特殊之處是它只能夠裝載在設(shè)計時刻已知的類,因此虛擬機(jī)假定由根裝載器所裝載的類都是安全的、可信任的,可以不經(jīng)過安全認(rèn)證而直接運(yùn)行。當(dāng)應(yīng)用程序需要加載并不是設(shè)計時就知道的類時,必須使用用戶自定義的裝載器(user-defined ClassLoader)。下面我們舉例說明它的應(yīng)用。
public abstract class MultiClassLoader extends ClassLoader{
...
public synchronized Class loadClass(String s, boolean flag)
throws ClassNotFoundException
{
/* 檢查類s是否已經(jīng)在本地內(nèi)存*/
Class class1 = (Class)classes.get(s);
/* 類s已經(jīng)在本地內(nèi)存*/
if(class1 != null) return class1;
try/*用默認(rèn)的ClassLoader 裝入類*/ {
class1 = super.findSystemClass(s);
return class1;
}
catch(ClassNotFoundException _ex) {
System.out.println(">> Not a system class.");
}
/* 取得類s的字節(jié)數(shù)組*/
byte abyte0[] = loadClassBytes(s);
if(abyte0 == null) throw new ClassNotFoundException();
/* 將類字節(jié)數(shù)組轉(zhuǎn)換為類*/
class1 = defineClass(null, abyte0, 0, abyte0.length);
if(class1 == null) throw new ClassFormatError();
if(flag) resolveClass(class1); /*解析類*/
/* 將新加載的類放入本地內(nèi)存*/
classes.put(s, class1);
System.out.println(">> Returning newly loaded class.");
/* 返回已裝載、解析的類*/
return class1;
}
...
}
三、Java虛擬機(jī)的類裝載原理
前面我們已經(jīng)知道,一個Java應(yīng)用程序使用兩種類型的類裝載器:根裝載器(bootstrap)和用戶定義的裝載器(user-defined)。根裝載器是Java虛擬機(jī)實(shí)現(xiàn)的一部分,舉個例子來說,如果一個Java虛擬機(jī)是在現(xiàn)在已經(jīng)存在并且正在被使用的操作系統(tǒng)的頂部用C程序來實(shí)現(xiàn)的,那么根裝載器將是那些C程序的一部分。根裝載器以某種默認(rèn)的方式將類裝入,包括那些Java API的類。在運(yùn)行期間一個Java程序能安裝用戶自己定義的類裝載器。根裝載器是虛擬機(jī)固有的一部分,而用戶定義的類裝載器則不是,它是用Java語言寫的,被編譯成class文件之后然后再被裝入到虛擬機(jī),并像其它的任何對象一樣可以被實(shí)例化。 Java類裝載器的體系結(jié)構(gòu)如下所示:
Java的類裝載模型是一種代理(delegation)模型。當(dāng)JVM 要求類裝載器CL(ClassLoader)裝載一個類時,CL首先將這個類裝載請求轉(zhuǎn)發(fā)給他的父裝載器。只有當(dāng)父裝載器沒有裝載并無法裝載這個類時,CL才獲得裝載這個類的機(jī)會。這樣, 所有類裝載器的代理關(guān)系構(gòu)成了一種樹狀的關(guān)系。樹的根是類的根裝載器(bootstrap ClassLoader) , 在JVM 中它以"null"表示。除根裝載器以外的類裝載器有且僅有一個父裝載器。在創(chuàng)建一個裝載器時, 如果沒有顯式地給出父裝載器, 那么JVM將默認(rèn)系統(tǒng)裝載器為其父裝載器。Java的基本類裝載器代理結(jié)構(gòu)如圖2所示:
下面針對各種類裝載器分別進(jìn)行詳細(xì)的說明。
根(Bootstrap) 裝載器:該裝載器沒有父裝載器,它是JVM實(shí)現(xiàn)的一部分,從sun.boot.class.path裝載運(yùn)行時庫的核心代碼。
擴(kuò)展(Extension) 裝載器:繼承的父裝載器為根裝載器,不像根裝載器可能與運(yùn)行時的操作系統(tǒng)有關(guān),這個類裝載器是用純Java代碼實(shí)現(xiàn)的,它從java.ext.dirs (擴(kuò)展目錄)中裝載代碼。
系統(tǒng)(System or Application) 裝載器:裝載器為擴(kuò)展裝載器,我們都知道在安裝JDK的時候要設(shè)置環(huán)境變量(CLASSPATH ),這個類裝載器就是從java.class.path(CLASSPATH 環(huán)境變量)中裝載代碼的,它也是用純Java代碼實(shí)現(xiàn)的,同時還是用戶自定義類裝載器的缺省父裝載器。
小應(yīng)用程序(Applet) 裝載器: 裝載器為系統(tǒng)裝載器,它從用戶指定的網(wǎng)絡(luò)上的特定目錄裝載小應(yīng)用程序代碼。
在設(shè)計一個類裝載器的時候,應(yīng)該滿足以下兩個條件:
對于相同的類名,類裝載器所返回的對象應(yīng)該是同一個類對象
如果類裝載器CL1將裝載類C的請求轉(zhuǎn)給類裝載器CL2,那么對于以下的類或接口,CL1和CL2應(yīng)該返回同一個類對象:a)S為C的直接超類;b)S為C的直接超接口;c)S為C的成員變量的類型;d)S為C的成員方法或構(gòu)建器的參數(shù)類型;e)S為C的成員方法的返回類型。
每個已經(jīng)裝載到JVM中的類都隱式含有裝載它的類裝載器的信息。類方法getClassLoader 可以得到裝載這個類的類裝載器。一個類裝載器認(rèn)識的類包括它的父裝載器認(rèn)識的類和它自己裝載的類,可見類裝載器認(rèn)識的類是它自己裝載的類的超集。注意我們可以得到類裝載器的有關(guān)的信息,但是已經(jīng)裝載到JVM中的類是不能更改它的類裝載器的。
Java中的類的裝載過程也就是代理裝載的過程。比如:Web瀏覽器中的JVM需要裝載一個小應(yīng)用程序TestApplet。JVM調(diào)用小應(yīng)用程序裝載器ACL(Applet ClassLoader)來完成裝載。ACL首先請求它的父裝載器, 即系統(tǒng)裝載器裝載TestApplet是否裝載了這個類, 由于TestApplet不在系統(tǒng)裝載器的裝載路徑中, 所以系統(tǒng)裝載器沒有找到這個類, 也就沒有裝載成功。接著ACL自己裝載TestApplet。ACL通過網(wǎng)絡(luò)成功地找到了TestApplet.class 文件并將它導(dǎo)入到了JVM中。在裝載過程中, JVM發(fā)現(xiàn)TestAppet是從超類java.applet.Applet繼承的。所以JVM再次調(diào)用ACL來裝載java.applet.Applet類。ACL又再次按上面的順序裝載Applet類, 結(jié)果ACL發(fā)現(xiàn)他的父裝載器已經(jīng)裝載了這個類, 所以ACL就直接將這個已經(jīng)裝載的類返回給了JVM , 完成了Applet類的裝載。接下來,Applet類的超類也一樣處理。最后, TestApplet及所有有關(guān)的類都裝載到了JVM中。
四、結(jié)論
類的動態(tài)裝載機(jī)制是JVM的一項(xiàng)核心技術(shù), 也是容易被忽視而引起很多誤解的地方。本文介紹了JVM中類裝載的原理、實(shí)現(xiàn)以及應(yīng)用,尤其分析了ClassLoader的結(jié)構(gòu)、用途以及如何利用自定義的ClassLoader裝載并執(zhí)行Java類,希望能使讀者對JVM中的類裝載有一個比較深入的理解
<filter>
<filter-name>Set Character Encoding</filter-name>
<filter-class>filters.SetCharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>GBK</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>Set Character Encoding</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
<Connector
port="80" maxThreads="150" minSpareThreads="25" maxSpareThreads="75"
enableLookups="false" redirectPort="8443" acceptCount="100"
debug="0" connectionTimeout="20000"
disableUploadTimeout="true"
URIEncoding="GBK"
/>
<%@ page contentType="text/html;charset=gb2312"%>
<%@ page import="java.util.*"%>
<%
String q=request.getParameter("q");
q = q == null? "沒有值" : q;
%>
<HTML>
<HEAD><TITLE>新聞列表顯示</TITLE>
<META http-equiv=Content-Type content="text/html; charset=gb2312">
<META http-equiv=pragma content=no-cache>
<body>
你提交了:
<%=q%>
<br>
<form action="tcnchar.jsp" method="post">
輸入中文:<input type="text" name="q"><input type="submit" value="確定">
<br>
<a href="tcnchar.jsp?q=中國">通過get方式提交</a>
</form>
</BODY></HTML>