空間站

北極心空

:: 管理

15 Posts :: 393 Stories :: 160 Comments :: 0 Trackbacks

版權(quán)聲明：轉(zhuǎn)載時(shí)請以超鏈接形式標(biāo)明文章原始出處和作者信息及本聲明
 http://eckelcn.blogbus.com/logs/8226879.html

一、hibernate的二級緩存
如果開啟了二級緩存，hibernate在執(zhí)行任何一次查詢的之后，都會(huì)把得到的結(jié)果集放到緩存中，緩存結(jié)構(gòu)可以看作是一個(gè)hash table，key是數(shù)據(jù)庫記錄的id，value是id對應(yīng)的pojo對象。當(dāng)用戶根據(jù)id查詢對象的時(shí)候（load、iterator方法），會(huì)首先在緩存中查找，如果沒有找到再發(fā)起數(shù)據(jù)庫查詢。但是如果使用hql發(fā)起查詢（find, query方法）則不會(huì)利用二級緩存，而是直接從數(shù)據(jù)庫獲得數(shù)據(jù)，但是它會(huì)把得到的數(shù)據(jù)放到二級緩存?zhèn)溆谩Ｒ簿褪钦f，基于hql的查詢，對二級緩存是只寫不讀的。
針對二級緩存的工作原理，采用iterator取代list來提高二級緩存命中率的想法是不可行的。Iterator的工作方式是根據(jù)檢索條件從數(shù)據(jù)庫中選取所有目標(biāo)數(shù)據(jù)的id，然后用這些id一個(gè)一個(gè)的到二級緩存里面做檢索，如果找到就直接加載，找不到就向數(shù)據(jù)庫做查詢。因此假如iterator檢索100條數(shù)據(jù)的話，最好情況是100%全部命中，最壞情況是0%命中，執(zhí)行101條sql把所有數(shù)據(jù)選出來。而list雖然不利用緩存，但是它只會(huì)發(fā)起1條sql取得所有數(shù)據(jù)。在合理利用分頁查詢的情況下，list整體效率高于iterator。
二級緩存的失效機(jī)制由hibernate控制，當(dāng)某條數(shù)據(jù)被修改之后，hibernate會(huì)根據(jù)它的id去做緩存失效操作。基于此機(jī)制，如果數(shù)據(jù)表不是被hibernate獨(dú)占（比如同時(shí)使用JDBC或者ado等），那么二級緩存無法得到有效控制。
由于hibernate的緩存接口很靈活，cache provider可以方便的切換，因此支持cluster環(huán)境不是大問題，通過使用swarmcache、jboss cache等支持分布式的緩存方案，可以實(shí)現(xiàn)。但是問題在于:
1、分布式緩存本身成本偏高（比如使用同步復(fù)制模式的jboss cache）
2、分布式環(huán)境通常對事務(wù)控制有較高要求，而目前的開源緩存方案對事務(wù)緩存（transaction cache）支持得不夠好。當(dāng)jta事務(wù)發(fā)生會(huì)滾，緩存的最后更新結(jié)果很難預(yù)料。這一點(diǎn)會(huì)帶來很大的部署成本，甚至得不償失。
結(jié)論：不應(yīng)把hibernate二級緩存作為優(yōu)化的主要手段，一般情況下建議不要使用。
原因如下：
1、由于hibernate批量操作的性能不如sql，而且為了兼容1.0的dao類，所以項(xiàng)目中有保留了sql操作。哪些數(shù)據(jù)表是單純被hibernate獨(dú)占無法統(tǒng)計(jì)，而且隨著將來業(yè)務(wù)的發(fā)展可能會(huì)有很大變數(shù)。因此不宜采用二級緩存。
2、針對系統(tǒng)業(yè)務(wù)來說，基于id檢索的二級緩存命中率極為有限，hql被大量采用，二級緩存對性能的提升很有限。
3、 hibernate 3.0在做批量修改、批量更新的時(shí)候，是不會(huì)同步更新二級緩存的，該問題在hibernate 3.2中是否仍然存在尚不確定。
二、hibernate的查詢緩存
查詢緩存的實(shí)現(xiàn)機(jī)制與二級緩存基本一致，最大的差異在于放入緩存中的key是查詢的語句，value是查詢之后得到的結(jié)果集的id列表。表面看來這樣的方案似乎能解決hql利用緩存的問題，但是需要注意的是，構(gòu)成key的是：hql生成的sql、sql的參數(shù)、排序、分頁信息等。也就是說如果你的hql有小小的差異，比如第一條hql取1-50條數(shù)據(jù)，第二條hql取20-60條數(shù)據(jù)，那么hibernate會(huì)認(rèn)為這是兩個(gè)完全不同的key，無法重復(fù)利用緩存。因此利用率也不高。
另外一個(gè)需要注意的問題是，查詢緩存和二級緩存是有關(guān)聯(lián)關(guān)系的，他們不是完全獨(dú)立的兩套東西。假如一個(gè)查詢條件hql_1，第一次被執(zhí)行的時(shí)候，它會(huì)從數(shù)據(jù)庫取得數(shù)據(jù)，然后把查詢條件作為key，把返回?cái)?shù)據(jù)的所有id列表作為value（請注意僅僅是id）放到查詢緩存中，同時(shí)整個(gè)結(jié)果集放到class緩存（也就是二級緩存），key是id，value是pojo對象。當(dāng)你再次執(zhí)行hql_1，它會(huì)從緩存中得到id列表，然后根據(jù)這些列表一個(gè)一個(gè)的到class緩存里面去找pojo對象，如果找不到就向數(shù)據(jù)庫發(fā)起查詢。也就是說，如果二級緩存配置了超時(shí)時(shí)間（或者發(fā)呆時(shí)間），就有可能出現(xiàn)查詢緩存命中了，獲得了id列表，但是class里面相應(yīng)的pojo已經(jīng)因?yàn)槌瑫r(shí)(或發(fā)呆)被失效，hibernate就會(huì)根據(jù)id清單，一個(gè)一個(gè)的去向數(shù)據(jù)庫查詢，有多少個(gè)id，就執(zhí)行多少個(gè)sql。該情況將導(dǎo)致性能下降嚴(yán)重。
查詢緩存的失效機(jī)制也由hibernate控制，數(shù)據(jù)進(jìn)入緩存時(shí)會(huì)有一個(gè)timestamp，它和數(shù)據(jù)表的timestamp對應(yīng)。當(dāng)hibernate環(huán)境內(nèi)發(fā)生save、update等操作時(shí)，會(huì)更新被操作數(shù)據(jù)表的timestamp。用戶在獲取緩存的時(shí)候，一旦命中就會(huì)檢查它的timestamp是否和數(shù)據(jù)表的timestamp匹配，如果不，緩存會(huì)被失效。因此查詢緩存的失效控制是以數(shù)據(jù)表為粒度的，只要數(shù)據(jù)表中任何一條記錄發(fā)生一點(diǎn)修改，整個(gè)表相關(guān)的所有查詢緩存就都無效了。因此查詢緩存的命中率可能會(huì)很低。
結(jié)論：不應(yīng)把hibernate二級緩存作為優(yōu)化的主要手段，一般情況下建議不要使用。
原因如下：
1、項(xiàng)目上層業(yè)務(wù)中檢索條件都比較復(fù)雜，尤其是涉及多表操作的地方。很少出現(xiàn)重復(fù)執(zhí)行一個(gè)排序、分頁、參數(shù)一致的查詢，因此命中率很難提高。
2、查詢緩存必須配合二級緩存一起使用，否則極易出現(xiàn)1+N的情況，否則性能不升反降
3、使用查詢緩存必須在執(zhí)行查詢之前顯示調(diào)用Query.setCacheable(true)才能激活緩存，這勢必會(huì)對已有的hibernate封裝類帶來問題。
總結(jié)
詳細(xì)分析hibernate的二級緩存和查詢緩存之后，在底層使用通用緩存方案的想法基本上是不可取的。比較好的做法是在高層次中（業(yè)務(wù)邏輯層面），針對具體的業(yè)務(wù)邏輯狀況手動(dòng)使用數(shù)據(jù)緩存，不僅可以完全控制緩存的生命周期，還可以針對業(yè)務(wù)具體調(diào)整緩存方案提交命中率。Cluster中的緩存同步可以完全交給緩存本身的同步機(jī)制來完成。比如開源緩存swarmcache采用invalidate的機(jī)制，可以根據(jù)用戶指定的策略，在需要的時(shí)候向網(wǎng)絡(luò)中的其他swarmcache節(jié)點(diǎn)發(fā)送失效消息，建議采用。

posted on 2008-08-01 17:10 蘆葦閱讀(3055) 評論(2) 編輯收藏所屬分類: JAVA 、Hibernate

Feedback

# re: 不要依賴hibernate的二級緩存 2008-12-13 11:34 jacky_87

聽你這么說好像用Hibernate沒多大用處，有時(shí)反而會(huì)降低系統(tǒng)的性能，如果是這樣的話，那為什么它會(huì)那么流行呢，為什么會(huì)那么多人使用它呢？回復(fù) 更多評論

# re: 不要依賴hibernate的二級緩存 2011-12-02 09:15 rietsu @foxmail. |com

我認(rèn)為緩存是用在一些修改不平凡的數(shù)據(jù)，并不能全面應(yīng)用。回復(fù) 更多評論

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關(guān)文章: 學(xué)習(xí)GXT的資料(轉(zhuǎn)) hibernate search分目錄存儲(chǔ)索引深入淺出REST 學(xué)習(xí) REST(簡單易懂) RestLet與Rest理論與實(shí)踐相結(jié)合（轉(zhuǎn)載） Restlet指南、Restlet之AJAX實(shí)踐 Restlet指南[Matrix社區(qū)試讀版] 在java中"模擬" XMLHttpRequest [轉(zhuǎn)] 常用的java函數(shù) 用JDOM輸出完整的XML文檔的例子

空間站

公告

常用鏈接

留言簿(15)

我參與的團(tuán)隊(duì)

隨筆分類

隨筆檔案

文章分類

文章檔案

收藏夾

blog收藏

搜索

最新評論

閱讀排行榜

評論排行榜

Feedback