BlueDavy之技術Blog

理論不懂就實踐，實踐不會就學理論！

一段好玩的測試LinkedBlockingQueue.poll超時的程序

在產品中有碰到過使用LinkedBlockingQueue.poll時超時很不準的現象，關鍵是這不是一般的不準，如果只是一點點不準的話也就勉強接受了，例如指定poll的超時時間為100ms，但最終執行.poll這段代碼就花費了8000ms的現象，這篇blog就是展示下通過一段小小的代碼來重現這樣的現象，畢竟沒有重現是無法證明為什么會出現這樣的現象的。

由于在出現這個現象的時候有看到過OutOfMemory的錯，雖然java進程沒退出，但猜想可能是這個原因造成的，于是寫了下面這段代碼：

public static void main(String[] args) throws Exception{
        long beginTime=System.currentTimeMillis();
        Map<String, byte[]> cache=new HashMap<String, byte[]>();
        for (int i = 0; i < 1000000; i++) {
            cache.put(String.valueOf(i),new byte[500]);
        }
        CountDownLatch latch=new CountDownLatch(25);
        for (int i = 0; i < 5; i++) {
            for (int j = 0; j < 5; j++) {
                Thread thread=new Thread(new TestThread(latch));
                thread.start();
            }
        }
        latch.await();
        long endTime=System.currentTimeMillis();
        System.out.println("總共執行時間："+(endTime-beginTime));
    }

    static class TestThread implements Runnable{

        private CountDownLatch latch;

        public TestThread(CountDownLatch latch){
            this.latch=latch;
        }

        public void run(){
            BlockingQueue<String> queue=new LinkedBlockingQueue<String>(1);
            try{
                for (int i = 0; i < 5; i++) {
                    long beginTime=System.currentTimeMillis();
                    queue.poll(100, TimeUnit.MILLISECONDS);
                    long endTime=System.currentTimeMillis();
                    long consumeTime=endTime-beginTime;
                    if(consumeTime>200)
                        System.out.println("獲取queue的時間為："+consumeTime);
                    @SuppressWarnings("unused")
                    byte[] bytesNew=new byte[25506000];
                }
            }
            catch(Exception e){
                ;
            }
            latch.countDown();
        }

    }

啟動上面程序時，將jvm參數設置為-Xms640M -Xmx640M，運行后，應該會看到有很多queue.poll執行超過200ms的現象，甚至會出現8000ms的現象。

上面整段程序的寫法就是用大量的小對象占據old generation，然后啟動多個線程，每個線程運行的時候new一個大的對象，讓其產生有可能直接從new generation分配到old generation，從而導致Full GC頻繁執行，里面的byte數組的大小的原則為：塞滿內存，產生Full GC，但又盡量不讓應用出現OutOfMemory，或者說不出現過于頻繁的OutOfMemory，避免jvm crash。

從上面程序的運行效果來看，當jvm內存消耗的很嚴重的情況下，poll的超時是沒法準的，其實分析下原因，還是挺正常的：
1、jvm內存消耗嚴重的情況下，Minor GC和Full GC瘋狂執行，導致了應用的執行不斷的被暫停，因此當線程已經進入poll等待后，這個線程沒有機會被執行，導致當其有機會執行時，早就超過了指定的超時時間，因此其超時不準并不是本身的機制導致的，而是jvm GC造成的多次暫停；
2、多次暫停的情況下，jvm需要不斷的調度恢復線程，這需要消耗很多的資源，而且切換多了Swap空間很容易不夠用，最終導致jvm crash。

posted on 2009-03-12 16:52 BlueDavy 閱讀(7813) 評論(4) 編輯收藏所屬分類: Java

這個應該和jdk的具體版本有關,不知道你們用的具體哪個版本的jdk。
我剛才試了一下用不同版本jdk運行的效果：
各版本的耗時不一樣：
1.7.0-nio2 ，基本都在359左右。
1.6.0_11 ，基本都在453左右。
1.5.0_14,基本在2359左右。

前段時間我們就是因為jdk的gc問題，對所有的服務器都進行了jdk升級到jdk1.6.0_12。

回復更多評論

# re: 一段好玩的測試LinkedBlockingQueue.poll超時的程序 2009-03-12 20:28 lizongbo

漏了補充說明，只在jdk1.5的時候運行出現了java.lang.OutOfMemoryError，而jdk1.6和jdk1.7都沒出現OutOfMemoryError.
回復更多評論

# re: 一段好玩的測試LinkedBlockingQueue.poll超時的程序 2009-03-12 20:34 BlueDavy

@lizongbo
多謝，:)，我之前還只在1.5.0_10上跑過，看來越新的java版本，性能確實越好，呵呵回復更多評論

# re: 一段好玩的測試LinkedBlockingQueue.poll超時的程序 2009-03-12 22:50 岑文初

觀察過,1.5肯定是不回收的,它的一個鎖信號量,1.6回收比較慢,要到一定的內存占用比例才會去Gc。SIP最早時候的內存泄露就是這個問題。回復更多評論

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: 關于《分布式Java應用：基礎與實踐》一書杭州程序員圓桌交流第二期視頻第一次杭州程序員交流會總結杭州程序員圓桌交流第一期–并發編程PPT GCLogViewer(tool to visualize gc log) V0.2 Release Simple Scala actor Vs java Thread Vs Kilim Test 《構建高性能的大型分布式Java應用》目錄&試讀樣章動態跟蹤Java代碼的執行狀況工具--BTrace GC策略的調優 Hessian 3.2.0的兩個bug