本文是作者:五月的倉頡 結(jié)合自己的工作和平時學習的體驗重新談一下為什么要進行代碼優(yōu)化,。在修改之前,,作者的說法是這樣的: 就像鯨魚吃蝦米一樣,也許吃一個兩個蝦米對于鯨魚來說作用不大,,但是吃的蝦米多了,,鯨魚自然飽了。 代碼優(yōu)化一樣,,也許一個兩個的優(yōu)化,,對于提升代碼的運行效率意義不大,但是只要處處都能注意代碼優(yōu)化,,總體來說對于提升代碼的運行效率就很有用了,。 這個觀點,在現(xiàn)在看來,,是要進行代碼優(yōu)化的一個原因,,但不全對。在機械工藝發(fā)展的今天,,服務(wù)器動輒8核,、16核,64位CPU,,代碼執(zhí)行效率非常高,,StringBuilder替換StringBuffer、ArrayList替換Vector,,對于代碼運行效率的提升是微乎其微的,,即使是項目中的每個點都注意到了,代碼運行也看不出什么明顯的變化,。 我認為,,代碼優(yōu)化的最重要的作用應(yīng)該是:避免未知的錯誤。在代碼上線運行的過程中,,往往會出現(xiàn)很多我們意想不到的錯誤,,因為線上環(huán)境和開發(fā)環(huán)境是非常不同的,,錯誤定位到最后往往是一個非常小的原因。然而為了解決這個錯誤,,我們需要先自驗證,、再打包出待替換的class文件、暫停業(yè)務(wù)并重啟,,對于一個成熟的項目而言,,最后一條其實影響是非常大的,這意味著這段時間用戶無法訪問應(yīng)用,。因此,,在寫代碼的時候,從源頭開始注意各種細節(jié),,權(quán)衡并使用最優(yōu)的選擇,,將會很大程度上避免出現(xiàn)未知的錯誤,從長遠看也極大的降低了工作量,。 一,、代碼優(yōu)化的目標是: 1、減小代碼的體積 2,、提高代碼運行的效率 本文的內(nèi)容有些來自網(wǎng)絡(luò),,有些來自平時工作和學習,當然這不重要,,重要的是這些代碼優(yōu)化的細節(jié)是否真真正正地有用,。那本文會保持長期更新,只要有遇到值得分享的代碼優(yōu)化細節(jié),,就會不定時地更新此文,。 二、代碼優(yōu)化細節(jié): 1,、盡量指定類,、方法的final修飾符 帶有final修飾符的類是不可派生的。在Java核心API中,,有許多應(yīng)用final的例子,,例如java.lang.String,整個類都是final的,。為類指定final修飾符可以讓類不可以被繼承,,為方法指定final修飾符可以讓方法不可以被重寫。如果指定了一個類為final,,則該類所有的方法都是final的,。Java編譯器會尋找機會內(nèi)聯(lián)所有的final方法,內(nèi)聯(lián)對于提升Java運行效率作用重大,具體參見Java運行期優(yōu)化,。此舉能夠使性能平均提高50%,。 2,、盡量重用對象 特別是String對象的使用,,出現(xiàn)字符串連接時應(yīng)該使用StringBuilder/StringBuffer代替。由于Java虛擬機不僅要花時間生成對象,,以后可能還需要花時間對這些對象進行垃圾回收和處理,,因此,生成過多的對象將會給程序的性能帶來很大的影響,。 3,、盡可能使用局部變量 調(diào)用方法時傳遞的參數(shù)以及在調(diào)用中創(chuàng)建的臨時變量都保存在棧中,速度較快,,其他變量,,如靜態(tài)變量、實例變量等,,都在堆中創(chuàng)建,,速度較慢。另外,,棧中創(chuàng)建的變量,,隨著方法的運行結(jié)束,這些內(nèi)容就沒了,,不需要額外的垃圾回收,。 4、及時關(guān)閉流 Java編程過程中,,進行數(shù)據(jù)庫連接,、I/O流操作時務(wù)必小心,在使用完畢后,,及時關(guān)閉以釋放資源,。因為對這些大對象的操作會造成系統(tǒng)大的開銷,稍有不慎,,將會導致嚴重的后果,。 5、盡量減少對變量的重復計算 明確一個概念,,對方法的調(diào)用,,即使方法中只有一句語句,也是有消耗的,,包括創(chuàng)建棧幀,、調(diào)用方法時保護現(xiàn)場、調(diào)用方法完畢時恢復現(xiàn)場等。所以例如下面的操作: 建議替換為: 這樣,,在list.size()很大的時候,,就減少了很多的消耗 6、盡量采用懶加載的策略,,即在需要的時候才創(chuàng)建 例如: 建議替換為: 7,、慎用異常 異常對性能不利。拋出異常首先要創(chuàng)建一個新的對象,,Throwable接口的構(gòu)造函數(shù)調(diào)用名為fillInStackTrace()的本地同步方法,,fillInStackTrace()方法檢查堆棧,收集調(diào)用跟蹤信息,。只要有異常被拋出,,Java虛擬機就必須調(diào)整調(diào)用堆棧,因為在處理過程中創(chuàng)建了一個新的對象,。異常只能用于錯誤處理,,不應(yīng)該用來控制程序流程。 8,、不要在循環(huán)中使用try…catch…,,應(yīng)該把其放在最外層 根據(jù)網(wǎng)友們提出的意見,這一點我認為值得商榷 9,、如果能估計到待添加的內(nèi)容長度,,為底層以數(shù)組方式實現(xiàn)的集合、工具類指定初始長度 比如ArrayList,、LinkedLlist,、StringBuilder、StringBuffer,、HashMap,、HashSet等等,以StringBuilder為例: 可以通過類(這里指的不僅僅是上面的StringBuilder)的構(gòu)造函數(shù)來設(shè)定它的初始化容量,,這樣可以明顯地提升性能,。比如StringBuilder吧,length表示當前的StringBuilder能保持的字符數(shù)量,。因為當StringBuilder達到最大容量的時候,,它會將自身容量增加到當前的2倍再加2,無論何時只要StringBuilder達到它的最大容量,,它就不得不創(chuàng)建一個新的字符數(shù)組然后將舊的字符數(shù)組內(nèi)容拷貝到新字符數(shù)組中—-這是十分耗費性能的一個操作,。試想,如果能預(yù)估到字符數(shù)組中大概要存放5000個字符而不指定長度,,最接近5000的2次冪是4096,,每次擴容加的2不管,,那么: 在4096 的基礎(chǔ)上,再申請8194個大小的字符數(shù)組,,加起來相當于一次申請了12290個大小的字符數(shù)組,,如果一開始能指定5000個大小的字符數(shù)組,就節(jié)省了一倍以上的空間,; 把原來的4096個字符拷貝到新的的字符數(shù)組中去,; 這樣,既浪費內(nèi)存空間又降低代碼運行效率,。所以,,給底層以數(shù)組實現(xiàn)的集合,、工具類設(shè)置一個合理的初始化容量是錯不了的,,這會帶來立竿見影的效果。但是,,注意,,像HashMap這種是以數(shù)組+鏈表實現(xiàn)的集合,別把初始大小和你估計的大小設(shè)置得一樣,,因為一個table上只連接一個對象的可能性幾乎為0,。初始大小建議設(shè)置為2的N次冪,如果能估計到有2000個元素,,設(shè)置成new HashMap(128),、new HashMap(256)都可以。 10,、當復制大量數(shù)據(jù)時,,使用System.arraycopy()命令 11、乘法和除法使用移位操作 例如: 用移位操作可以極大地提高性能,,因為在計算機底層,,對位的操作是最方便、最快的,,因此建議修改為: 移位操作雖然快,,但是可能會使代碼不太好理解,因此最好加上相應(yīng)的注釋,。 12,、循環(huán)內(nèi)不要不斷創(chuàng)建對象引用 例如: 這種做法會導致內(nèi)存中有count份Object對象引用存在,count很大的話,,就耗費內(nèi)存了,,建議為改為: 這樣的話,內(nèi)存中只有一份Object對象引用,,每次new Object()的時候,,Object對象引用指向不同的Object罷了,,但是內(nèi)存中只有一份,這樣就大大節(jié)省了內(nèi)存空間了,。 13,、基于效率和類型檢查的考慮,應(yīng)該盡可能使用array,,無法確定數(shù)組大小時才使用ArrayList 14,、盡量使用HashMap、ArrayList,、StringBuilder,,除非線程安全需要,否則不推薦使用Hashtable,、Vector,、StringBuffer,后三者由于使用同步機制而導致了性能開銷 15,、不要將數(shù)組聲明為public static final 因為這毫無意義,,這樣只是定義了引用為static final,數(shù)組的內(nèi)容還是可以隨意改變的,,將數(shù)組聲明為public更是一個安全漏洞,,這意味著這個數(shù)組可以被外部類所改變 16、盡量在合適的場合使用單例 使用單例可以減輕加載的負擔,、縮短加載的時間,、提高加載的效率,但并不是所有地方都適用于單例,,簡單來說,,單例主要適用于以下三個方面: (1)控制資源的使用,通過線程同步來控制資源的并發(fā)訪問,; (2)控制實例的產(chǎn)生,,以達到節(jié)約資源的目的; (3)控制數(shù)據(jù)的共享,,在不建立直接關(guān)聯(lián)的條件下,,讓多個不相關(guān)的進程或線程之間實現(xiàn)通信; 17,、盡量避免隨意使用靜態(tài)變量 要知道,,當某個對象被定義為static的變量所引用,那么gc通常是不會回收這個對象所占有的堆內(nèi)存的,,如: 此時靜態(tài)變量b的生命周期與A類相同,,如果A類不被卸載,那么引用B指向的B對象會常駐內(nèi)存,,直到程序終止,。 18,、及時清除不再需要的會話 為了清除不再活動的會話,許多應(yīng)用服務(wù)器都有默認的會話超時時間,,一般為30分鐘,。當應(yīng)用服務(wù)器需要保存更多的會話時,如果內(nèi)存不足,,那么操作系統(tǒng)會把部分數(shù)據(jù)轉(zhuǎn)移到磁盤,,應(yīng)用服務(wù)器也可能根據(jù)MRU(最近最頻繁使用)算法把部分不活躍的會話轉(zhuǎn)儲到磁盤,甚至可能拋出內(nèi)存不足的異常,。如果會話要被轉(zhuǎn)儲到磁盤,,那么必須要先被序列化,在大規(guī)模集群中,,對對象進行序列化的代價是很昂貴的,。因此,當會話不再需要時,,應(yīng)當及時調(diào)用HttpSession的invalidate()方法清除會話,。 19、實現(xiàn)RandomAccess接口的集合比如ArrayList,,應(yīng)當使用最普通的for循環(huán)而不是foreach循環(huán)來遍歷 這是JDK推薦給用戶的。JDK API對于RandomAccess接口的解釋是:實現(xiàn)RandomAccess接口用來表明其支持快速隨機訪問,,此接口的主要目的是允許一般的算法更改其行為,,從而將其應(yīng)用到隨機或連續(xù)訪問列表時能提供良好的性能。實際經(jīng)驗表明,,實現(xiàn)RandomAccess接口的類實例,,假如是隨機訪問的,使用普通for循環(huán)效率將高于使用foreach循環(huán),;反過來,,如果是順序訪問的,則使用Iterator會效率更高,??梢允褂妙愃迫缦碌拇a作判斷: foreach循環(huán)的底層實現(xiàn)原理就是迭代器Iterator,參見Java語法糖1:可變長度參數(shù)以及foreach循環(huán)原理,。所以后半句”反過來,,如果是順序訪問的,則使用Iterator會效率更高”的意思就是順序訪問的那些類實例,,使用foreach循環(huán)去遍歷,。 20、使用同步代碼塊替代同步方法 這點在多線程模塊中的synchronized鎖方法塊一文中已經(jīng)講得很清楚了,,除非能確定一整個方法都是需要進行同步的,,否則盡量使用同步代碼塊,,避免對那些不需要進行同步的代碼也進行了同步,影響了代碼執(zhí)行效率,。 21,、將常量聲明為static final,并以大寫命名 這樣在編譯期間就可以把這些內(nèi)容放入常量池中,,避免運行期間計算生成常量的值,。另外,將常量的名字以大寫命名也可以方便區(qū)分出常量與變量 22,、不要創(chuàng)建一些不使用的對象,,不要導入一些不使用的類 這毫無意義,如果代碼中出現(xiàn)”The value of the local variable i is not used”,、”The import java.util is never used”,,那么請刪除這些無用的內(nèi)容 23、程序運行過程中避免使用反射 關(guān)于,,請參見反射,。反射是Java提供給用戶一個很強大的功能,功能強大往往意味著效率不高,。不建議在程序運行過程中使用尤其是頻繁使用反射機制,,特別是Method的invoke方法,如果確實有必要,,一種建議性的做法是將那些需要通過反射加載的類在項目啟動的時候通過反射實例化出一個對象并放入內(nèi)存—-用戶只關(guān)心和對端交互的時候獲取最快的響應(yīng)速度,,并不關(guān)心對端的項目啟動花多久時間。 24,、使用數(shù)據(jù)庫連接池和線程池 這兩個池都是用于重用對象的,,前者可以避免頻繁地打開和關(guān)閉連接,后者可以避免頻繁地創(chuàng)建和銷毀線程 25,、使用帶緩沖的輸入輸出流進行IO操作 帶緩沖的輸入輸出流,,即BufferedReader、BufferedWriter,、BufferedInputStream,、BufferedOutputStream,這可以極大地提升IO效率 26,、順序插入和隨機訪問比較多的場景使用ArrayList,,元素刪除和中間插入比較多的場景使用LinkedList 這個,理解ArrayList和LinkedList的原理就知道了 27,、不要讓public方法中有太多的形參 public方法即對外提供的方法,,如果給這些方法太多形參的話主要有兩點壞處: (1)違反了面向?qū)ο蟮木幊趟枷耄琂ava講求一切都是對象,,太多的形參,,和面向?qū)ο蟮木幊趟枷氩⒉黄鹾希?/span> (2)參數(shù)太多勢必導致方法調(diào)用的出錯概率增加,; 至于這個”太多”指的是多少個,3,、4個吧,。比如我們用JDBC寫一個insertStudentInfo方法,有10個學生信息字段要插如Student表中,,可以把這10個參數(shù)封裝在一個實體類中,,作為insert方法的形參 28、字符串變量和字符串常量equals的時候?qū)⒆址A繉懺谇懊?/span> 這是一個比較常見的小技巧了,,如果有以下代碼: 建議修改為: 這么做主要是可以避免空指針異常 29,、請知道,在java中if (i == 1)和if (1 == i)是沒有區(qū)別的,,但從閱讀習慣上講,,建議使用前者 平時有人問,”if (i == 1)”和”if (1== i)”有沒有區(qū)別,,這就要從C/C++講起,。 在C/C++中,”if (i == 1)”判斷條件成立,,是以0與非0為基準的,,0表示false,非0表示true,,如果有這么一段代碼: C/C++判斷”i==1″不成立,,所以以0表示,即false,。但是如果: 萬一程序員一個不小心,把”if (i == 1)”寫成”if (i = 1)”,,這樣就有問題了,。在if之內(nèi)將i賦值為1,if判斷里面的內(nèi)容非0,,返回的就是true了,,但是明明i為2,比較的值是1,,應(yīng)該返回的false,。這種情況在C/C++的開發(fā)中是很可能發(fā)生的并且會導致一些難以理解的錯誤產(chǎn)生,所以,,為了避免開發(fā)者在if語句中不正確的賦值操作,,建議將if語句寫為: 這樣,即使開發(fā)者不小心寫成了”1 = i”,,C/C++編譯器也可以第一時間檢查出來,,因為我們可以對一個變量賦值i為1,,但是不能對一個常量賦值1為i。 但是,,在Java中,,C/C++這種”if (i = 1)”的語法是不可能出現(xiàn)的,因為一旦寫了這種語法,,Java就會編譯報錯”Type mismatch: cannot convert from int to boolean“,。但是,盡管Java的”if (i == 1)”和”if (1 == i)”在語義上沒有任何區(qū)別,,從閱讀習慣上講,,建議使用前者會更好些。 30,、不要對數(shù)組使用toString()方法 看一下對數(shù)組使用toString()打印出來的是什么: 本意是想打印出數(shù)組內(nèi)容,,卻有可能因為數(shù)組引用is為空而導致空指針異常。不過雖然對數(shù)組toString()沒有意義,,但是對集合toString()是可以打印出集合里面的內(nèi)容的,,因為集合的父類AbstractCollections 31,、不要對超出范圍的基本數(shù)據(jù)類型做向下強制轉(zhuǎn)型 這絕不會得到想要的結(jié)果: 我們可能期望得到其中的某幾位,,但是結(jié)果卻是: 解釋一下。Java中l(wèi)ong是8個字節(jié)64位的,,所以12345678901234在計算機中的表示應(yīng)該是:
一個int型數(shù)據(jù)是4個字節(jié)32位的,,從低位取出上面這串二進制數(shù)據(jù)的前32位是:
這串二進制表示為十進制1942892530,所以就是我們上面的控制臺上輸出的內(nèi)容,。從這個例子上還能順便得到兩個結(jié)論: (1)整型默認的數(shù)據(jù)類型是int,,long l = 12345678901234L,這個數(shù)字已經(jīng)超出了int的范圍了,,所以最后有一個L,,表示這是一個long型數(shù)。順便,,浮點型的默認類型是double,,所以定義float的時候要寫成”'float f = 3.5f” (2)接下來再寫一句”int ii = l + i;”會報錯,因為long + int是一個long,,不能賦值給int 32,、公用的集合類中不使用的數(shù)據(jù)一定要及時remove掉 如果一個集合類是公用的(也就是說不是方法里面的屬性),那么這個集合里面的元素是不會自動釋放的,,因為始終有引用指向它們,。所以,如果公用集合里面的某些數(shù)據(jù)不使用而不去remove掉它們,那么將會造成這個公用集合不斷增大,,使得系統(tǒng)有內(nèi)存泄露的隱患,。 33、把一個基本數(shù)據(jù)類型轉(zhuǎn)為字符串,,基本數(shù)據(jù)類型.toString()是最快的方式,、String.valueOf(數(shù)據(jù))次之、數(shù)據(jù)+”'最慢 把一個基本數(shù)據(jù)類型轉(zhuǎn)為一般有三種方式,,我有一個Integer型數(shù)據(jù)i,,可以使用i.toString()、String.valueOf(i),、i+”'三種方式,,三種方式的效率如何,看一個測試: 運行結(jié)果為: 所以以后遇到把一個基本數(shù)據(jù)類型轉(zhuǎn)為String的時候,,優(yōu)先考慮使用toString()方法,。至于為什么,很簡單: (1)String.valueOf()方法底層調(diào)用了Integer.toString()方法,,但是會在調(diào)用前做空判斷,; (2)Integer.toString()方法就不說了,直接調(diào)用了,; (3)i + “”底層使用了StringBuilder實現(xiàn),,先用append方法拼接,再用toString()方法獲取字符串,; 三者對比下來,,明顯是2最快、1次之,、3最慢,。 34、使用最有效率的方式去遍歷Map 遍歷Map的方式有很多,,通常場景下我們需要的是遍歷Map中的Key和Value,,那么推薦使用的、效率最高的方式是: 如果你只是想遍歷一下這個Map的key值,,那用”Set 35,、對資源的close()建議分開操作 意思是,,比如我有這么一段代碼: 建議修改為: 雖然有些麻煩,卻能避免資源泄露,。我們想,,如果沒有修改過的代碼,萬一XXX.close()拋異常了,,那么就進入了catch塊中了,,YYY.close()不會執(zhí)行,,YYY這塊資源就不會回收了,一直占用著,,這樣的代碼一多,,是可能引起資源句柄泄露的。而改為下面的寫法之后,,就保證了無論如何XXX和YYY都會被close掉,。 36、對于ThreadLocal使用前或者使用后一定要先remove 當前基本所有的項目都使用了線程池技術(shù),,這非常好,,可以動態(tài)配置線程數(shù)、可以重用線程,。 然而,,如果你在項目中使用到了ThreadLocal,一定要記得使用前或者使用后remove一下,。這是因為上面提到了線程池技術(shù)做的是一個線程重用,,這意味著代碼運行過程中,一條線程使用完畢,,并不會被銷毀而是等待下一次的使用,。我們看一下Thread類中,持有ThreadLocal.ThreadLocalMap的引用: 線程不銷毀意味著上條線程set的ThreadLocal.ThreadLocalMap中的數(shù)據(jù)依然存在,,那么在下一條線程重用這個Thread的時候,,很可能get到的是上條線程set的數(shù)據(jù)而不是自己想要的內(nèi)容。 這個問題非常隱晦,,一旦出現(xiàn)這個原因?qū)е碌腻e誤,,沒有相關(guān)經(jīng)驗或者沒有扎實的基礎(chǔ)非常難發(fā)現(xiàn)這個問題,因此在寫代碼的時候就要注意這一點,,這將給你后續(xù)減少很多的工作量,。 37、切記以常量定義的方式替代魔鬼數(shù)字,,魔鬼數(shù)字的存在將極大地降低代碼可讀性,,字符串常量是否使用常量定義可以視情況而 38、long或者Long初始賦值時,,使用大寫的L而不是小寫的l,,因為字母l極易與數(shù)字1混淆,這個點非常細節(jié),,值得注意 39,、所有重寫的方法必須保留@Override注解 這么做有三個原因: (1)清楚地可以知道這個方法由父類繼承而來; (2)getObject()和get0bject()方法,前者第四個字母是”O(jiān)”,,后者第四個子母是”0″,,加了@Override注解可以馬上判斷是否重寫成功; (3)在抽象類中對方法簽名進行修改,,實現(xiàn)類會馬上報出編譯錯誤,; 40、推薦使用JDK7中新引入的Objects工具類來進行對象的equals比較,,直接a.equals(b),,有空指針異常的風險 41、循環(huán)體內(nèi)不要使用”+”進行字符串拼接,,而直接使用StringBuilder不斷append 說一下不使用”+”進行字符串拼接的原因,,假如我有一個方法: 將這段代碼編譯之后的.class文件,使用javap -c進行反編譯一下,,截取關(guān)鍵的一部分: 意思就是每次虛擬機碰到”+”這個操作符對字符串進行拼接的時候,,會new出一個StringBuilder,然后調(diào)用append方法,,最后調(diào)用toString()方法轉(zhuǎn)換字符串賦值給oriStr對象,,即循環(huán)多少次,就會new出多少個StringBuilder()來,,這對于內(nèi)存是一種浪費,。 42、不捕獲Java類庫中定義的繼承自RuntimeException的運行時異常類 異常處理效率低,,RuntimeException的運行時異常類,,其中絕大多數(shù)完全可以由程序員來規(guī)避,比如: (1)ArithmeticException可以通過判斷除數(shù)是否為空來規(guī)避,; (2)NullPointerException可以通過判斷對象是否為空來規(guī)避,; (3)IndexOutOfBoundsException可以通過判斷數(shù)組/字符串長度來規(guī)避; (4)ClassCastException可以通過instanceof關(guān)鍵字來規(guī)避,; (5)ConcurrentModificationException可以使用迭代器來規(guī)避,; 43、避免Random實例被多線程使用,,雖然共享該實例是線程安全的,,但會因競爭同一seed 導致的性能下降,JDK7之后,,可以使用ThreadLocalRandom來獲取隨機數(shù) 解釋一下競爭同一個seed導致性能下降的原因,,比如,看一下Random類的nextInt()方法實現(xiàn): 調(diào)用了next(int bits)方法,,這是一個受保護的方法: 而這邊的seed是一個全局變量: 多個線程同時獲取隨機數(shù)的時候,會競爭同一個seed,導致了效率的降低,。 44,、靜態(tài)類、單例類,、工廠類將它們的構(gòu)造函數(shù)置為private 這是因為靜態(tài)類,、單例類、工廠類這種類本來我們就不需要外部將它們new出來,,將構(gòu)造函數(shù)置為private之后,,保證了這些類不會產(chǎn)生實例對象。 后記 優(yōu)秀的代碼來自每一點點小小的優(yōu)化,,關(guān)注每一個細節(jié),,不僅僅能提升程序運行效率,同樣可以規(guī)避許多未知的問題,。 |
|