放翁（文初）的一畝三分地

BlogJava :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合

:: 管理 ::

210 隨筆 :: 1 文章 :: 320 評論 :: 0 Trackbacks

<

2008年8月

>

日

一

二

三

四

五

六

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

常用鏈接

留言簿(34)

隨筆檔案

淘寶同學(xué)的blog

丹臣同學(xué)的blog
丹臣同學(xué)的blog

搜索

閱讀排行榜

評論排行榜

Memcache Hash算法值得探索的內(nèi)容

集團(tuán)內(nèi)部很多團(tuán)隊(duì)都使用Memcache來提高應(yīng)用性能，最近的一次工作匯報(bào)中提及了Memcache的Hash算法需要研究來滿足一些需求，同時(shí)提高Memcache的利用效率。討論了一下最后自己總結(jié)了這么幾點(diǎn)是對Hash算法需要著重考慮的。

問題：

1. 存儲數(shù)據(jù)如何均勻分散。如何把數(shù)據(jù)盡可能的散開存儲，這樣對于Memcache的可擴(kuò)展性才會有充分利用，試想如果算法每次都會把數(shù)據(jù)定向到某幾臺機(jī)器，那么就會導(dǎo)致集群機(jī)器之間利用率的不均衡，無法發(fā)揮出集群效應(yīng)。

2. 增減機(jī)器減小對原有數(shù)據(jù)存取的影響。由于業(yè)務(wù)量的增長勢必需要對后端的服務(wù)器有所擴(kuò)容，但是增加或者減少機(jī)器如何盡可能小的影響已有的緩存數(shù)據(jù)，這點(diǎn)直接影響業(yè)務(wù)處理以及應(yīng)用的效率。

3. 提高Memcache效率。Memcache在壓力測試下也會暴露出對于網(wǎng)絡(luò)資源的消耗問題，畢竟也是網(wǎng)絡(luò)間的Socket數(shù)據(jù)交互。

解決的一些思路和方法：

1． Consistent Hashing是一種比較好的解決思路?？梢詤⒖匆幌拢?/span>http://tech.idv2.com/2008/07/24/memcached-004/ 其中主要兩個(gè)亮點(diǎn)就是稀釋節(jié)點(diǎn)以及環(huán)狀分區(qū)段管理。稀釋節(jié)點(diǎn)就是將原來的節(jié)點(diǎn)再復(fù)制幾十倍，使得離散度更高，數(shù)據(jù)更加分散。環(huán)狀分區(qū)段管理，就能夠?qū)?shù)據(jù)分區(qū)管理，在加入和減少節(jié)點(diǎn)時(shí)對數(shù)據(jù)產(chǎn)生影響最低，最好的類比就是解放前的地下工作者單線聯(lián)系，如果被捕不會涉及到所有的地下黨同志。

2．集群的機(jī)器使用Memcache最好結(jié)合本地Cache，這里我們自己寫了一個(gè)本地的類似于Memcache有超時(shí)時(shí)間Cache，兩者結(jié)合一起使用緩存信息，在壓力測試下提高了20%左右的性能。這里和我們的系統(tǒng)也有關(guān)系，我們對于Memcache有比較大的依賴，雖然已經(jīng)對于每一個(gè)請求處理都防止重復(fù)獲取信息，將必要信息放在線程上下文中，但是在運(yùn)行期間還是會有不少的請求。

存儲到Memcache中的數(shù)據(jù)類型：

1．一次寫入多次讀，很少更新。這種數(shù)據(jù)系統(tǒng)啟動以后構(gòu)建，在非命中情況下不采用從后備數(shù)據(jù)源中獲取數(shù)據(jù)來填充Memcache。（也是提高效率，同時(shí)防止一些攻擊性的請求）

2．多次寫入多次讀取。這類數(shù)據(jù)往往是在運(yùn)行期被構(gòu)建，非命中下會從后備數(shù)據(jù)源中獲取，或者是某一種計(jì)算結(jié)果的緩存。

對于第一類數(shù)據(jù)來說，增加機(jī)器需要重新構(gòu)建，如果采用分區(qū)分段，那么只需要構(gòu)建某一部分的數(shù)據(jù)，或者是移動數(shù)據(jù)。對于第二類數(shù)據(jù)，增加機(jī)器如果采用簡單的Hash算法也問題不大，最多存儲多份，命中率降低，但是如果采用分區(qū)，也可以降低命中率下降的情況。

這里只是拋出問題，后續(xù)如何解決請各位看官各抒己見了。當(dāng)然這里自己也會考慮這方面的實(shí)現(xiàn)和設(shè)計(jì)。

posted on 2008-08-14 10:36 岑文初閱讀(3444) 評論(1) 編輯收藏


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問管理