posts - 12, comments - 3, trackbacks - 0, articles - 0
            BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

          Tokyocabinet數據存放探秘

          Posted on 2009-12-29 10:22 創意恒動力 閱讀(769) 評論(0)  編輯  收藏
          弄了一段時間的tokyocabinet btree結構數據庫。
          存儲的時候發現,tokyocabinet sync同步時,先讓數據存放在內存,然后對比同步文件和內存的數據,使數據達到一直。
          sync()這個tc方法易用,但不好控制。
          稍有不慎就會使持久化文件容量以幾何級數遞增。

          之前自己用mina框架做了一個btree的網絡鏈接端口,起初內存一直飆升。弄了很久都不明白。
          開始以為是mina造成的,而且cpu占用率居高不下。

          后來拆分測試。發現單獨mina的數據傳輸,內存并不高,非常低。
          但是tc的單獨測試發現,寫文件的cpu占用率特高,多線程寫入的情況下,會有明顯阻塞。
          初步了解了jvm gc的算法,如果cpu占用率搞,gc回收內存的能力會明顯下降。
          為了解決這一點,修改了一下網絡端口的框架結構。

          把數據接受端跟數據處理端分開:
          1.接受端可以接受多個socket多線程傳輸,而數據處理端鎖定只接受從接收端的一個或不超過5個scoket傳輸數據。
          對tc的操作,單線程寫入,感覺上比多線程處理流暢,特別在同步優化文件那一刻。
          優化文件,需要的cpu和內存都比較厲害。
          2.tc接受數據以后,不要馬上寫文本。等接受一批(100-10000)數據后,再使用同步方法。
          3.參照第2條,定期優化文件,這樣不至于文件過大。但是數據量增大,文件雖然優化了,寫入速度不會怎么改變。
          4.優化同步文件后,特別在數據量在不斷增大的情況下。不要以為沒有回收內存,其實gc已經很努力回收(長時間觀察jprofiler的統計數據證明了這一點)當你向tc取數據的時候,你會發現,內存會逐級遞減。


          經過一番調整,用jprofiler測試,自己搭建的網絡框架,內存鎖定在250m左右。
          可能到實際運行的時候,內存占用量會增加,但是只會達到一個相當的穩定值。
          現用于公司的隊列系統,內存總量不超過600m,偶爾超過是由于同步文件造成的,等數據穩定后,內存會回到穩定值。以后再作優化,希望能把內存壓制200m左右。

          初學nio,以此為記。


          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 张家港市| 阳春市| 拉萨市| 理塘县| 宣汉县| 清远市| 东乡族自治县| 鄯善县| 师宗县| 岢岚县| 道孚县| 彩票| 东阳市| 西峡县| 孝昌县| 平果县| 美姑县| 麻江县| 陵川县| 房产| 商洛市| 高要市| 双流县| 宜兴市| 苏尼特右旗| 铜陵市| 吉木萨尔县| 巴楚县| 白玉县| 濮阳市| 磴口县| 油尖旺区| 汤阴县| 镇宁| 彝良县| 库尔勒市| 孝感市| 通州区| 昔阳县| 浦东新区| 嵊州市|