布衣王子

          Email:roose2008@gmail.com QQ:79212131

          如何分析Java虛擬機死鎖

          如何分析Java虛擬機死鎖

          我發現現在網上沒有好好講這個的,少數的幾篇文章都是大談自己的工具,卻沒把方法講清楚。我決定以我以前碰到的case為例寫一篇來分享。

          到目前為止,我認為分析Java代碼問題的最有效的工具仍然是java thread dump。原因:

          - 任何操作系統平臺下都可以使用。

          - 在多數情況下,可以在生產環境中使用。

          - 和操作系統提供的工具相比,java thread dump給出的信息是直白的,直接對應到應用代碼。

          - 它對被分析的系統干擾很小,因此能反應真實的問題。而其它很多profiling或Instrument工具本身對JVM運行有很大的干擾,經常不能暴露出真正的問題,而且這種工具不能用于生產系統。


          我覺得在通常情況下分析Java虛擬機死鎖比分析內存泄漏要容易的多。因為死鎖發生時,JVM通常處于掛起狀態(hang住了),thread dump可以給出靜態穩定的信息,查找死鎖只需要查找有問題的線程。而內存泄漏的問題卻很難界定,一個運行的JVM里有無數對象存在,只有寫程序的人才知道哪些對象是垃圾,而哪些不是,而且對象的引用關系非常復雜,很難得到一份清晰的對象引用圖。

          Java虛擬機死鎖發生時,從操作系統上觀察,虛擬機的CPU占用率為零,很快會從top或prstat的輸出中消失。這時你就可以收集thread dump了,Unix/Linux 下是kill -3 <JVM pid>,在Windows下可以在JVM的console窗口上敲Ctrl-Break。根據不同的設置,thread dump會輸出到當前控制臺上或應用服務器的日志里。

          拿到java thread dump后,你要做的就是查找"waiting for monitor entry"的thread,如果大量thread都在等待給同一個地址上鎖(因為對于Java,一個對象只有一把鎖),這說明很可能死鎖發生了。比如:


          "service-j2ee" prio=5 tid=0x024f1c28 nid=0x125 waiting for monitor entry
          [62a3e000..62a3f690]
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          com.sun.enterprise.resource.IASNonSharedResourcePool.internalGetResource(IASNonS
          haredResourcePool.java:625)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: - waiting to
          lock <0x965d8110>
          (a com.sun.enterprise.resource.IASNonSharedResourcePool)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          com.sun.enterprise.resource.IASNonSharedResourcePool.getResource(IASNonSharedRes
          ourcePool.java:520)
          ................

          為了確定問題,常常需要在隔兩分鐘后再次收集一次thread dump,如果得到的輸出相同,仍然是大量thread都在等待給同一個地址上鎖,那么肯定是死鎖了。

          如何找到當前持有鎖的線程是解決問題的關鍵。方法是搜索thread dump,查找"locked <0x965d8110>", 找到持有鎖的線程。


          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: "Thread-20" daemon prio=5 tid=0x01394f18
          nid=0x109 runnable [6716f000..6716fc28]
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          java.net.SocketInputStream.socketRead0(Native Method)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          java.net.SocketInputStream.read(SocketInputStream.java:129)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at oracle.net.ns.Packet.receive(Unknown
          Source)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          oracle.net.ns.DataPacket.receive(Unknown Source)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          oracle.net.ns.NetInputStream.getNextPacket(Unknown Source)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          oracle.net.ns.NetInputStream.read(Unknown Source)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          oracle.net.ns.NetInputStream.read(Unknown Source)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          oracle.net.ns.NetInputStream.read(Unknown Source)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          oracle.jdbc.ttc7.MAREngine.unmarshalUB1(MAREngine.java:929)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          oracle.jdbc.ttc7.MAREngine.unmarshalSB1(MAREngine.java:893)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          oracle.jdbc.ttc7.Ocommoncall.receive(Ocommoncall.java:106)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          oracle.jdbc.ttc7.TTC7Protocol.logoff(TTC7Protocol.java:396)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: - locked <0x954f47a0> (a
          oracle.jdbc.ttc7.TTC7Protocol)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          oracle.jdbc.driver.OracleConnection.close(OracleConnection.java:1518)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: - locked <0x954f4520> (a
          oracle.jdbc.driver.OracleConnection)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          com.sun.enterprise.resource.JdbcUrlAllocator.destroyResource(JdbcUrlAllocator.java:122)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          com.sun.enterprise.resource.IASNonSharedResourcePool.destroyResource(IASNonSharedResourcePool.java:8
          72)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          com.sun.enterprise.resource.IASNonSharedResourcePool.resizePool(IASNonSharedResourcePool.java:1086)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: - locked <0x965d8110> (a
          com.sun.enterprise.resource.IASNonSharedResourcePool)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          com.sun.enterprise.resource.IASNonSharedResourcePool$Resizer.run(IASNonSharedResourcePool.java:1178)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          java.util.TimerThread.mainLoop(Timer.java:432)
          [27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at
          java.util.TimerThread.run(Timer.java:382)

          在這個例子里,持有鎖的線程在等待Oracle返回結果,卻始終等不到響應,因此發生了死鎖。

          如果持有鎖的線程還在等待給另一個對象上鎖,那么還是按上面的辦法順藤摸瓜,直到找到死鎖的根源為止。

          另外,在thread dump里還會經常看到這樣的線程,它們是等待一個條件而主動放棄鎖的線程。例如:

          "Thread-1" daemon prio=5 tid=0x014e97a8 nid=0x80 in Object.wait() [68c6f000..68c6fc28]
          at java.lang.Object.wait(Native Method)
          - waiting on <0x95b07178> (a java.util.LinkedList)
          at com.iplanet.ias.util.collection.BlockingQueue.remove(BlockingQueue.java:258)
          - locked <0x95b07178> (a java.util.LinkedList)
          at com.iplanet.ias.util.threadpool.FastThreadPool$ThreadPoolThread.run(FastThreadPool.java:241)
          at java.lang.Thread.run(Thread.java:534)

          有時也會需要分析這類線程,尤其是線程等待的條件。

          其實,Java thread dump并不只用于分析死鎖,其它Java應用運行時古怪的行為都可以用thread dump來分析。

          最后,在Java SE 5里,增加了jstack的工具,也可以獲取thread dump。在Java SE 6里, 通過jconsole的圖形化工具也可以方便地查找涉及object monitors 和java.util.concurrent.locks死鎖。

          posted on 2008-06-22 20:56 草包書生 閱讀(1285) 評論(0)  編輯  收藏


          只有注冊用戶登錄后才能發表評論。


          網站導航:
           

          導航

          常用鏈接

          相冊

          java的相關連接

          最新評論

          主站蜘蛛池模板: 金湖县| 山东省| 青海省| 长治县| 永仁县| 荣昌县| 武定县| 玉环县| 博白县| 莎车县| 育儿| 台安县| 连城县| 邵武市| 阳原县| 丹东市| 新巴尔虎左旗| 酉阳| 五河县| 集贤县| 攀枝花市| 高雄县| 手游| 改则县| 偃师市| 双辽市| 淳化县| 确山县| 五台县| 新建县| 两当县| 绩溪县| 石首市| 景洪市| 九龙城区| 金华市| 汶上县| 桐梓县| 定日县| 望谟县| 张掖市|