1 資料

2 GC日志打印

  GC調(diào)優(yōu)是個很實驗很伽利略的活兒,GC日志是先決的數(shù)據(jù)參考和最終驗證:

-XX:+PrintGCDetails -XX:+PrintGCTimeStamps(GC發(fā)生的時間) -XX:+PrintGCApplicationStoppedTime(GC消耗了多少時間) -XX:+PrintGCApplicationConcurrentTime(GC之間運行了多少時間)

3 收集器選擇

CMS收集器:暫停時間優(yōu)先

   配置參數(shù):-XX:+UseConcMarkSweepGC
   已默認無需配置的參數(shù):-XX:+UseParNewGC(Parallel收集新生代) -XX:+CMSPermGenSweepingEnabled(CMS收集持久代) -XX:UseCMSCompactAtFullCollection(full gc時壓縮年老代)

   初始效果:1g堆內(nèi)存的新生代約60m,minor gc約5-20毫秒,full gc約130毫秒。

Parallel收集器:吞吐量優(yōu)先

    配置參數(shù): -XX:+UseParallelGC -XX:+UseParallelOldGC(Parallel收集年老代,從JDK6.0開始支持)

    已默認無需配置的參數(shù): -XX:+UseAdaptiveSizePolicy(動態(tài)調(diào)整新生代大小)

    初始效果:1g堆內(nèi)存的新生代約90-110m(動態(tài)調(diào)整),minor gc約5-20毫秒,full gc有無UseParallelOldGC 參數(shù)分別為1.3/1.1秒,差別不大。

    另外-XX:MaxGCPauseMillis=100 設置minor gc的期望最大時間,JVM會以此來調(diào)整新生代的大小,但在此測試環(huán)境中對象死的太快,此參數(shù)作用不大。

4 調(diào)優(yōu)實戰(zhàn)

      Parallel收集高達1秒的暫停時間基本不可忍受,所以選擇CMS收集器。

      在被壓測的Mule 2.0應用里,每秒都有大約400M的海量短命對象產(chǎn)生:

  1. 因為默認60M的新生代太小了,頻繁發(fā)生minor gc,大約0.2秒就進行一次。
  2. 因為CMS收集器中MaxTenuringThreshold(生代對象撐過過多少次minor gc才進入年老代的設置)默認0,存活的臨時對象不經(jīng)過Survivor區(qū)直接進入年老代,不久就占滿年老代發(fā)生full gc。

     對這兩個參數(shù)的調(diào)優(yōu),既要改善上面兩種情況,又要避免新生代過大,復制次數(shù)過多造成minor gc的暫停時間過長。

  1. 使用-Xmn調(diào)到1/3 總內(nèi)存。觀察后設置-Xmn500M,新生代實際約460m。(用-XX:NewRatio設置無效,只能用 -Xmn)。
  2. 添加-XX:+PrintTenuringDistribution 參數(shù)觀察各個Age的對象總大小,觀察后設置-XX:MaxTenuringThreshold=5。

      優(yōu)化后,大約1.1秒才發(fā)生一次minor gc,且速度依然保持在15-20ms之間。同時年老代的增長速度大大減緩,很久才發(fā)生一次full gc,

      參數(shù)定稿:

 -Xms1024m -Xmx1024m -Xmn500m -XX:+UseConcMarkSweepGC   -XX:MaxTenuringThreshold=5  -XX:+ExplicitGCInvokesConcurrent

      最后服務處理速度從1180 tps 上升到1380 tps,調(diào)整兩個參數(shù)提升17%的性能還是筆很劃算的買賣。