少年阿賓

          那些青春的歲月

            BlogJava :: 首頁 :: 聯(lián)系 :: 聚合  :: 管理
            500 Posts :: 0 Stories :: 135 Comments :: 0 Trackbacks
          最近因項(xiàng)目存在內(nèi)存泄漏,故進(jìn)行大規(guī)模的JVM性能調(diào)優(yōu) 現(xiàn)把經(jīng)驗(yàn)做一記錄。

          一、JVM內(nèi)存模型及垃圾收集算法

           1.根據(jù)Java虛擬機(jī)規(guī)范,JVM將內(nèi)存劃分為:

          • New(年輕代)
          • Tenured(年老代)
          • 永久代(Perm)

            其中New和Tenured屬于堆內(nèi)存,堆內(nèi)存會(huì)從JVM啟動(dòng)參數(shù)(-Xmx:3G)指定的內(nèi)存中分配,Perm不屬于堆內(nèi)存,有虛擬機(jī)直接分配,但可以通過-XX:PermSize -XX:MaxPermSize 等參數(shù)調(diào)整其大小。

          • 年輕代(New):年輕代用來存放JVM剛分配的Java對(duì)象
          • 年老代(Tenured):年輕代中經(jīng)過垃圾回收沒有回收掉的對(duì)象將被Copy到年老代
          • 永久代(Perm):永久代存放Class、Method元信息,其大小跟項(xiàng)目的規(guī)模、類、方法的量有關(guān),一般設(shè)置為128M就足夠,設(shè)置原則是預(yù)留30%的空間。

          New又分為幾個(gè)部分:

          • Eden:Eden用來存放JVM剛分配的對(duì)象
          • Survivor1
          • Survivro2:兩個(gè)Survivor空間一樣大,當(dāng)Eden中的對(duì)象經(jīng)過垃圾回收沒有被回收掉時(shí),會(huì)在兩個(gè)Survivor之間來回Copy,當(dāng)滿足某個(gè)條件,比如Copy次數(shù),就會(huì)被Copy到Tenured。顯然,Survivor只是增加了對(duì)象在年輕代中的逗留時(shí)間,增加了被垃圾回收的可能性。

           2.垃圾回收算法

            垃圾回收算法可以分為三類,都基于標(biāo)記-清除(復(fù)制)算法:

          • Serial算法(單線程)
          • 并行算法
          • 并發(fā)算法

            JVM會(huì)根據(jù)機(jī)器的硬件配置對(duì)每個(gè)內(nèi)存代選擇適合的回收算法,比如,如果機(jī)器多于1個(gè)核,會(huì)對(duì)年輕代選擇并行算法,關(guān)于選擇細(xì)節(jié)請(qǐng)參考JVM調(diào)優(yōu)文檔。

            稍微解釋下的是,并行算法是用多線程進(jìn)行垃圾回收,回收期間會(huì)暫停程序的執(zhí)行,而并發(fā)算法,也是多線程回收,但期間不停止應(yīng)用執(zhí)行。所以,并發(fā)算法適用于交互性高的一些程序。經(jīng)過觀察,并發(fā)算法會(huì)減少年輕代的大小,其實(shí)就是使用了一個(gè)大的年老代,這反過來跟并行算法相比吞吐量相對(duì)較低。

            還有一個(gè)問題是,垃圾回收動(dòng)作何時(shí)執(zhí)行?

          • 當(dāng)年輕代內(nèi)存滿時(shí),會(huì)引發(fā)一次普通GC,該GC僅回收年輕代。需要強(qiáng)調(diào)的時(shí),年輕代滿是指Eden代滿,Survivor滿不會(huì)引發(fā)GC
          • 當(dāng)年老代滿時(shí)會(huì)引發(fā)Full GC,F(xiàn)ull GC將會(huì)同時(shí)回收年輕代、年老代
          • 當(dāng)永久代滿時(shí)也會(huì)引發(fā)Full GC,會(huì)導(dǎo)致Class、Method元信息的卸載

            另一個(gè)問題是,何時(shí)會(huì)拋出OutOfMemoryException,并不是內(nèi)存被耗空的時(shí)候才拋出

          • JVM98%的時(shí)間都花費(fèi)在內(nèi)存回收
          • 每次回收的內(nèi)存小于2%

            滿足這兩個(gè)條件將觸發(fā)OutOfMemoryException,這將會(huì)留給系統(tǒng)一個(gè)微小的間隙以做一些Down之前的操作,比如手動(dòng)打印Heap Dump。

          二、內(nèi)存泄漏及解決方法

           1.系統(tǒng)崩潰前的一些現(xiàn)象:

            • 每次垃圾回收的時(shí)間越來越長,由之前的10ms延長到50ms左右,F(xiàn)ullGC的時(shí)間也有之前的0.5s延長到4、5s
            • FullGC的次數(shù)越來越多,最頻繁時(shí)隔不到1分鐘就進(jìn)行一次FullGC
            • 年老代的內(nèi)存越來越大并且每次FullGC后年老代沒有內(nèi)存被釋放

               之后系統(tǒng)會(huì)無法響應(yīng)新的請(qǐng)求,逐漸到達(dá)OutOfMemoryError的臨界值。

               2.生成堆的dump文件

               通過JMX的MBean生成當(dāng)前的Heap信息,大小為一個(gè)3G(整個(gè)堆的大小)的hprof文件,如果沒有啟動(dòng)JMX可以通過Java的jmap命令來生成該文件。

               3.分析dump文件

               下面要考慮的是如何打開這個(gè)3G的堆信息文件,顯然一般的Window系統(tǒng)沒有這么大的內(nèi)存,必須借助高配置的Linux。當(dāng)然我們可以借助X-Window把Linux上的圖形導(dǎo)入到Window。我們考慮用下面幾種工具打開該文件:

              1. Visual VM
              2. IBM HeapAnalyzer
              3. JDK 自帶的Hprof工具

               使用這些工具時(shí)為了確保加載速度,建議設(shè)置最大內(nèi)存為6G。使用后發(fā)現(xiàn),這些工具都無法直觀地觀察到內(nèi)存泄漏,Visual VM雖能觀察到對(duì)象大小,但看不到調(diào)用堆棧;HeapAnalyzer雖然能看到調(diào)用堆棧,卻無法正確打開一個(gè)3G的文件。因此,我們又選用了Eclipse專門的靜態(tài)內(nèi)存分析工具:Mat。

               4.分析內(nèi)存泄漏

               通過Mat我們能清楚地看到,哪些對(duì)象被懷疑為內(nèi)存泄漏,哪些對(duì)象占的空間最大及對(duì)象的調(diào)用關(guān)系。針對(duì)本案,在ThreadLocal中有很多的JbpmContext實(shí)例,經(jīng)過調(diào)查是JBPM的Context沒有關(guān)閉所致。

               另,通過Mat或JMX我們還可以分析線程狀態(tài),可以觀察到線程被阻塞在哪個(gè)對(duì)象上,從而判斷系統(tǒng)的瓶頸。

               5.回歸問題

                 Q:為什么崩潰前垃圾回收的時(shí)間越來越長?

                 A:根據(jù)內(nèi)存模型和垃圾回收算法,垃圾回收分兩部分:內(nèi)存標(biāo)記、清除(復(fù)制),標(biāo)記部分只要內(nèi)存大小固定時(shí)間是不變的,變的是復(fù)制部分,因?yàn)槊看卫厥斩加幸恍┗厥詹坏舻膬?nèi)存,所以增加了復(fù)制量,導(dǎo)致時(shí)間延長。所以,垃圾回收的時(shí)間也可以作為判斷內(nèi)存泄漏的依據(jù)

                 Q:為什么Full GC的次數(shù)越來越多?

                 A:因此內(nèi)存的積累,逐漸耗盡了年老代的內(nèi)存,導(dǎo)致新對(duì)象分配沒有更多的空間,從而導(dǎo)致頻繁的垃圾回收

                 Q:為什么年老代占用的內(nèi)存越來越大?

                 A:因?yàn)槟贻p代的內(nèi)存無法被回收,越來越多地被Copy到年老代

              三、性能調(diào)優(yōu)

               除了上述內(nèi)存泄漏外,我們還發(fā)現(xiàn)CPU長期不足3%,系統(tǒng)吞吐量不夠,針對(duì)8core×16G、64bit的Linux服務(wù)器來說,是嚴(yán)重的資源浪費(fèi)。

               在CPU負(fù)載不足的同時(shí),偶爾會(huì)有用戶反映請(qǐng)求的時(shí)間過長,我們意識(shí)到必須對(duì)程序及JVM進(jìn)行調(diào)優(yōu)。從以下幾個(gè)方面進(jìn)行:

              • 線程池:解決用戶響應(yīng)時(shí)間長的問題
              • 連接池
              • JVM啟動(dòng)參數(shù):調(diào)整各代的內(nèi)存比例和垃圾回收算法,提高吞吐量
              • 程序算法:改進(jìn)程序邏輯算法提高性能

                1.Java線程池(java.util.concurrent.ThreadPoolExecutor)

                  大多數(shù)JVM6上的應(yīng)用采用的線程池都是JDK自帶的線程池,之所以把成熟的Java線程池進(jìn)行羅嗦說明,是因?yàn)樵摼€程池的行為與我們想象的有點(diǎn)出入。Java線程池有幾個(gè)重要的配置參數(shù):

              • corePoolSize:核心線程數(shù)(最新線程數(shù))
              • maximumPoolSize:最大線程數(shù),超過這個(gè)數(shù)量的任務(wù)會(huì)被拒絕,用戶可以通過RejectedExecutionHandler接口自定義處理方式
              • keepAliveTime:線程保持活動(dòng)的時(shí)間
              • workQueue:工作隊(duì)列,存放執(zhí)行的任務(wù)

                  Java線程池需要傳入一個(gè)Queue參數(shù)(workQueue)用來存放執(zhí)行的任務(wù),而對(duì)Queue的不同選擇,線程池有完全不同的行為:

              • SynchronousQueue: 一個(gè)無容量的等待隊(duì)列,一個(gè)線程的insert操作必須等待另一線程的remove操作,采用這個(gè)Queue線程池將會(huì)為每個(gè)任務(wù)分配一個(gè)新線程
              • LinkedBlockingQueue 無界隊(duì)列,采用該Queue,線程池將忽略 maximumPoolSize參數(shù),僅用corePoolSize的線程處理所有的任務(wù),未處理的任務(wù)便在LinkedBlockingQueue中排隊(duì)
              • ArrayBlockingQueue: 有界隊(duì)列,在有界隊(duì)列和 maximumPoolSize的作用下,程序?qū)⒑茈y被調(diào)優(yōu):更大的Queue和小的maximumPoolSize將導(dǎo)致CPU的低負(fù)載;小的Queue和大的池,Queue就沒起動(dòng)應(yīng)有的作用。

                  其實(shí)我們的要求很簡單,希望線程池能跟連接池一樣,能設(shè)置最小線程數(shù)、最大線程數(shù),當(dāng)最小數(shù)<任務(wù)<最大數(shù)時(shí),應(yīng)該分配新的線程處理;當(dāng)任務(wù)>最大數(shù)時(shí),應(yīng)該等待有空閑線程再處理該任務(wù)。

                  但線程池的設(shè)計(jì)思路是,任務(wù)應(yīng)該放到Queue中,當(dāng)Queue放不下時(shí)再考慮用新線程處理,如果Queue滿且無法派生新線程,就拒絕該任務(wù)。設(shè)計(jì)導(dǎo)致“先放等執(zhí)行”、“放不下再執(zhí)行”、“拒絕不等待”。所以,根據(jù)不同的Queue參數(shù),要提高吞吐量不能一味地增大maximumPoolSize。

                  當(dāng)然,要達(dá)到我們的目標(biāo),必須對(duì)線程池進(jìn)行一定的封裝,幸運(yùn)的是ThreadPoolExecutor中留了足夠的自定義接口以幫助我們達(dá)到目標(biāo)。我們封裝的方式是:

              • 以SynchronousQueue作為參數(shù),使maximumPoolSize發(fā)揮作用,以防止線程被無限制的分配,同時(shí)可以通過提高maximumPoolSize來提高系統(tǒng)吞吐量
              • 自定義一個(gè)RejectedExecutionHandler,當(dāng)線程數(shù)超過maximumPoolSize時(shí)進(jìn)行處理,處理方式為隔一段時(shí)間檢查線程池是否可以執(zhí)行新Task,如果可以把拒絕的Task重新放入到線程池,檢查的時(shí)間依賴keepAliveTime的大小。

                2.連接池(org.apache.commons.dbcp.BasicDataSource)

                  在使用org.apache.commons.dbcp.BasicDataSource的時(shí)候,因?yàn)橹安捎昧四J(rèn)配置,所以當(dāng)訪問量大時(shí),通過JMX觀察到很多Tomcat線程都阻塞在BasicDataSource使用的Apache ObjectPool的鎖上,直接原因當(dāng)時(shí)是因?yàn)锽asicDataSource連接池的最大連接數(shù)設(shè)置的太小,默認(rèn)的BasicDataSource配置,僅使用8個(gè)最大連接。

                  我還觀察到一個(gè)問題,當(dāng)較長的時(shí)間不訪問系統(tǒng),比如2天,DB上的Mysql會(huì)斷掉所以的連接,導(dǎo)致連接池中緩存的連接不能用。為了解決這些問題,我們充分研究了BasicDataSource,發(fā)現(xiàn)了一些優(yōu)化的點(diǎn):

              • Mysql默認(rèn)支持100個(gè)鏈接,所以每個(gè)連接池的配置要根據(jù)集群中的機(jī)器數(shù)進(jìn)行,如有2臺(tái)服務(wù)器,可每個(gè)設(shè)置為60
              • initialSize:參數(shù)是一直打開的連接數(shù)
              • minEvictableIdleTimeMillis:該參數(shù)設(shè)置每個(gè)連接的空閑時(shí)間,超過這個(gè)時(shí)間連接將被關(guān)閉
              • timeBetweenEvictionRunsMillis:后臺(tái)線程的運(yùn)行周期,用來檢測過期連接
              • maxActive:最大能分配的連接數(shù)
              • maxIdle:最大空閑數(shù),當(dāng)連接使用完畢后發(fā)現(xiàn)連接數(shù)大于maxIdle,連接將被直接關(guān)閉。只有initialSize < x < maxIdle的連接將被定期檢測是否超期。這個(gè)參數(shù)主要用來在峰值訪問時(shí)提高吞吐量。
              • initialSize是如何保持的?經(jīng)過研究代碼發(fā)現(xiàn),BasicDataSource會(huì)關(guān)閉所有超期的連接,然后再打開initialSize數(shù)量的連接,這個(gè)特性與minEvictableIdleTimeMillis、timeBetweenEvictionRunsMillis一起保證了所有超期的initialSize連接都會(huì)被重新連接,從而避免了Mysql長時(shí)間無動(dòng)作會(huì)斷掉連接的問題。

                3.JVM參數(shù)

                  在JVM啟動(dòng)參數(shù)中,可以設(shè)置跟內(nèi)存、垃圾回收相關(guān)的一些參數(shù)設(shè)置,默認(rèn)情況不做任何設(shè)置JVM會(huì)工作的很好,但對(duì)一些配置很好的Server和具體的應(yīng)用必須仔細(xì)調(diào)優(yōu)才能獲得最佳性能。通過設(shè)置我們希望達(dá)到一些目標(biāo):

              • GC的時(shí)間足夠的小
              • GC的次數(shù)足夠的少
              • 發(fā)生Full GC的周期足夠的長

                前兩個(gè)目前是相悖的,要想GC時(shí)間小必須要一個(gè)更小的堆,要保證GC次數(shù)足夠少,必須保證一個(gè)更大的堆,我們只能取其平衡。

                 (1)針對(duì)JVM堆的設(shè)置一般,可以通過-Xms -Xmx限定其最小、最大值,為了防止垃圾收集器在最小、最大之間收縮堆而產(chǎn)生額外的時(shí)間,我們通常把最大、最小設(shè)置為相同的值
                 (2)年輕代和年老代將根據(jù)默認(rèn)的比例(1:2)分配堆內(nèi)存,可以通過調(diào)整二者之間的比率NewRadio來調(diào)整二者之間的大小,也可以針對(duì)回收代,比如年輕代,通過 -XX:newSize -XX:MaxNewSize來設(shè)置其絕對(duì)大小。同樣,為了防止年輕代的堆收縮,我們通常會(huì)把-XX:newSize -XX:MaxNewSize設(shè)置為同樣大小

                 (3)年輕代和年老代設(shè)置多大才算合理?這個(gè)我問題毫無疑問是沒有答案的,否則也就不會(huì)有調(diào)優(yōu)。我們觀察一下二者大小變化有哪些影響

              • 更大的年輕代必然導(dǎo)致更小的年老代,大的年輕代會(huì)延長普通GC的周期,但會(huì)增加每次GC的時(shí)間;小的年老代會(huì)導(dǎo)致更頻繁的Full GC
              • 更小的年輕代必然導(dǎo)致更大年老代,小的年輕代會(huì)導(dǎo)致普通GC很頻繁,但每次的GC時(shí)間會(huì)更短;大的年老代會(huì)減少Full GC的頻率
              • 如何選擇應(yīng)該依賴應(yīng)用程序?qū)ο笊芷诘姆植记闆r:如果應(yīng)用存在大量的臨時(shí)對(duì)象,應(yīng)該選擇更大的年輕代;如果存在相對(duì)較多的持久對(duì)象,年老代應(yīng)該適當(dāng)增大。但很多應(yīng)用都沒有這樣明顯的特性,在抉擇時(shí)應(yīng)該根據(jù)以下兩點(diǎn):(A)本著Full GC盡量少的原則,讓年老代盡量緩存常用對(duì)象,JVM的默認(rèn)比例1:2也是這個(gè)道理 (B)通過觀察應(yīng)用一段時(shí)間,看其他在峰值時(shí)年老代會(huì)占多少內(nèi)存,在不影響Full GC的前提下,根據(jù)實(shí)際情況加大年輕代,比如可以把比例控制在1:1。但應(yīng)該給年老代至少預(yù)留1/3的增長空間

                (4)在配置較好的機(jī)器上(比如多核、大內(nèi)存),可以為年老代選擇并行收集算法: -XX:+UseParallelOldGC ,默認(rèn)為Serial收集

                (5)線程堆棧的設(shè)置:每個(gè)線程默認(rèn)會(huì)開啟1M的堆棧,用于存放棧幀、調(diào)用參數(shù)、局部變量等,對(duì)大多數(shù)應(yīng)用而言這個(gè)默認(rèn)值太了,一般256K就足用。理論上,在內(nèi)存不變的情況下,減少每個(gè)線程的堆棧,可以產(chǎn)生更多的線程,但這實(shí)際上還受限于操作系統(tǒng)。

                (4)可以通過下面的參數(shù)打Heap Dump信息

              • -XX:HeapDumpPath
              • -XX:+PrintGCDetails
              • -XX:+PrintGCTimeStamps
              • -Xloggc:/usr/aaa/dump/heap_trace.txt

                  通過下面參數(shù)可以控制OutOfMemoryError時(shí)打印堆的信息

              • -XX:+HeapDumpOnOutOfMemoryError

               請(qǐng)看一下一個(gè)時(shí)間的Java參數(shù)配置:(服務(wù)器:Linux 64Bit,8Core×16G)

               JAVA_OPTS="$JAVA_OPTS -server -Xms3G -Xmx3G -Xss256k -XX:PermSize=128m -XX:MaxPermSize=128m -XX:+UseParallelOldGC -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/usr/aaa/dump -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xloggc:/usr/aaa/dump/heap_trace.txt -XX:NewSize=1G -XX:MaxNewSize=1G"

              經(jīng)過觀察該配置非常穩(wěn)定,每次普通GC的時(shí)間在10ms左右,F(xiàn)ull GC基本不發(fā)生,或隔很長很長的時(shí)間才發(fā)生一次

              通過分析dump文件可以發(fā)現(xiàn),每個(gè)1小時(shí)都會(huì)發(fā)生一次Full GC,經(jīng)過多方求證,只要在JVM中開啟了JMX服務(wù),JMX將會(huì)1小時(shí)執(zhí)行一次Full GC以清除引用,關(guān)于這點(diǎn)請(qǐng)參考附件文檔。

               4.程序算法調(diào)優(yōu):本次不作為重點(diǎn)

              參考資料:

              http://java.sun.com/javase/technologies/hotspot/gc/gc_tuning_6.html

              posted on 2013-05-31 15:49 abin 閱讀(532) 評(píng)論(0)  編輯  收藏 所屬分類: JVM
              主站蜘蛛池模板: 淮安市| 广河县| 绵阳市| 建水县| 克拉玛依市| 鹤山市| 长汀县| 左权县| 林周县| 东至县| 綦江县| 新竹县| 泗洪县| 北流市| 沾益县| 互助| 铁岭市| 博兴县| 襄樊市| 红安县| 邵东县| 正阳县| 岳阳市| 老河口市| 常宁市| 大同县| 夏河县| 东方市| 新化县| 句容市| 张家川| 桐柏县| 启东市| 昭苏县| 定南县| 佛学| 景德镇市| 安化县| 康乐县| 兰坪| 瑞昌市|