永久亚洲成a人片777777,成人av二区,精品国产综合久久

SSTableä½œäØ“å˜å‚¨ä½¿ç”¨

Tablet Serving

Updates are committed to a commit log that stores redo records. Of these updates, the recently committed ones are stored in memory in a sorted buffer called a memtable; the older updates are stored in a sequence of SSTables. To recover a tablet, a tablet server reads its metadata from the METADATA table. This metadata contains the list of SSTables that comprise a tablet and a set of a redo points, which are pointers into any commit logs that may contain data for the tablet. The server reads the indices of the SSTables into memory and reconstructs the memtable by applying all of the updates that have committed since the redo points.

When a write operation arrives at a tablet server, the server checks that it is well-formed, and that the sender is authorized to perform the mutation. Authorization is performed by reading the list of permitted writers from a Chubby file (which is almost always a hit in the Chubby client cache). A valid mutation is written to the commit log. Group commit is used to improve the throughput of lots of small mutations [13, 16]. After the write has been committed, its contents are inserted into the memtable.

When a read operation arrives at a tablet server, it is similarly checked for well-formedness and proper authorization. A valid read operation is executed on a merged view of the sequence of SSTables and the memtable. Since the SSTables and the memtable are lexicographically sorted data structures, the merged view can be formed efficiently.

Incoming read and write operations can continue while tablets are split and merged.

½W¬ä¸€ŒDµå’Œ½W¬ä¸‰ŒDëŠ®€å•æ˜qŽÍ¼Œéžç¿»è¯‘ï¼š
åœ¨æ–°æ•°æ®å†™å…¥æ—Óž¼Œ˜q™ä¸ªæ“ä½œé¦–å…ˆæäº¤åˆ°æ—¥å¿—ä¸ä½œäØ“redo¾Uªå½•åQŒæœ€˜q‘çš„æ•°æ®å˜å‚¨åœ¨å†…å˜çš„æŽ’åº¾~“å˜memtableä¸ï¼›æ—§çš„æ•°æ®å˜å‚¨åœ¨ä¸€¾pÕdˆ—çš„SSTable ä¸ã€‚åœ¨recoverä¸ï¼Œtablet serverä»ŽMETADATAè¡¨ä¸è¯Õd–metadataåQŒmetadataåŒ…å«äº†ç»„æˆTabletçš„æ‰€æœ‰SSTableåQˆçºªå½•äº†˜q™äº›SSTableçš„å…ƒ æ•°æ®ä¿¡æ¯åQŒå¦‚SSTableçš„ä½¾|®ã€StartKeyã€EndKey½{‰ï¼‰ä»¥åŠä¸€¾pÕdˆ—æ—¥å¿—ä¸çš„redoç‚V€‚Tablet Serverè¯Õd–SSTableçš„çƒ¦å¼•åˆ°å†…å˜åQŒåÆˆreplay˜q™äº›redoç‚¹ä¹‹åŽçš„æ›´æ–°æ¥é‡æž„memtableã€?br />åœ¨è¯»æ—Óž¼Œå®Œæˆæ ¼å¼ã€æŽˆæƒç‰‹‚€æŸ¥åŽåQŒè¯»ä¼šåŒæ—¶è¯»å–SSTableã€memtableåQˆHBaseä¸è¿˜åŒ…å«äº†BlockCacheä¸çš„æ•°æ®åQ‰åÆˆåˆåÆˆä»–ä»¬çš„ç»“æžœï¼Œç”×ƒºŽSSTableå’Œmemtableéƒ½æ˜¯å—å…¸åºæŽ’åˆ—ï¼Œå› è€Œåˆòq¶æ“ä½œå¯ä»¥å¾ˆé«˜æ•ˆå®Œæˆã€?br />

SSTableåœ¨Compaction˜q‡ç¨‹ä¸çš„ä½¿ç”¨

Compaction

As write operations execute, the size of the memtable increases. When the memtable size reaches a threshold, the memtable is frozen, a new memtable is created, and the frozen memtable is converted to an SSTable and written to GFS. This minor compaction process has two goals: it shrinks the memory usage of the tablet server, and it reduces the amount of data that has to be read from the commit log during recovery if this server dies. Incoming read and write operations can continue while compactions occur.

Every minor compaction creates a new SSTable. If this behavior continued unchecked, read operations might need to merge updates from an arbitrary number of SSTables. Instead, we bound the number of such files by periodically executing a merging compaction in the background. A merging compaction reads the contents of a few SSTables and the memtable, and writes out a new SSTable. The input SSTables and memtable can be discarded as soon as the compaction has finished.

A merging compaction that rewrites all SSTables into exactly one SSTable is called a major compaction. SSTables produced by non-major compactions can contain special deletion entries that suppress deleted data in older SSTables that are still live. A major compaction, on the other hand, produces an SSTable that contains no deletion information or deleted data. Bigtable cycles through all of its tablets and regularly applies major compactions to them. These major compactions allow Bigtable to reclaim resources used by deleted data, and also allow it to ensure that deleted data disappears from the system in a timely fashion, which is important for services that store sensitive data.

éšç€memtableå¤§å°å¢žåŠ åˆîC¸€ä¸ªé˜€å€û|¼Œ˜q™ä¸ªmemtableä¼šè¢«å†ÖM½è€Œåˆ›å»ÞZ¸€ä¸ªæ–°çš„memtableä»¥ä¾›ä½¿ç”¨åQŒè€Œæ—§çš„memtableä¼šè{æ¢æˆä¸€ä¸ªSSTableè€Œå†™é“GFSä¸ï¼Œ˜q™ä¸ª˜q‡ç¨‹å«åšminor compactionã€‚è¿™ä¸ªminor compactionå¯ä»¥å‡å°‘å†…å˜ä½¿ç”¨é‡ï¼Œòq¶å¯ä»¥å‡ž®‘æ—¥å¿—å¤§ž®ï¼Œå› äØ“æŒä¹…åŒ–åŽçš„æ•°æ®å¯ä»¥ä»Žæ—¥å¿—ä¸åˆ é™¤ã€?/span>åœ¨minor compaction˜q‡ç¨‹ä¸ï¼Œå¯ä»¥¾l§ç®‹å¤„ç†è¯Õd†™è¯äh±‚ã€?br />æ¯æ¬¡minor compactionä¼šç”Ÿæˆæ–°çš„SSTableæ–‡äšgåQŒå¦‚æžœSSTableæ–‡äšgæ•°é‡å¢žåŠ åQŒåˆ™ä¼šåª„å“è¯»çš„æ€§èƒ½åQŒå› è€Œæ¯‹Æ¡è¯»éƒ½éœ€è¦è¯»å–æ‰€æœ‰SSTableæ–‡äšgåQŒç„¶åŽåˆòq¶ç»“æžœï¼Œå› è€Œå¯¹SSTableæ–‡äšgä¸ªæ•°éœ€è¦æœ‰ä¸Šé™åQŒåÆˆä¸”æ—¶ä¸æ—¶çš„éœ€è¦åœ¨åŽå°åšmerging compactionåQŒè¿™ä¸ªmerging compactionè¯Õd–ä¸€äº›SSTableæ–‡äšgå’Œmemtableçš„å†…å®¹ï¼Œòq¶å°†ä»–ä»¬åˆåÆˆå†™å…¥ä¸€ä¸ªæ–°çš„SSTableä¸ã€‚å½“˜q™ä¸ª˜q‡ç¨‹å®ŒæˆåŽï¼Œ˜q™äº›æºSSTableå’Œmemtablež®±å¯ä»¥è¢«åˆ é™¤äº†ã€?br />å¦‚æžœä¸€ä¸ªmerging compactionæ˜¯åˆòq¶æ‰€æœ‰SSTableåˆîC¸€ä¸ªSSTableåQŒåˆ™˜q™ä¸ª˜q‡ç¨‹¿U°åšmajor compactionã€‚ä¸€‹Æ¡major compactionä¼šå°†markæˆåˆ é™¤çš„ä¿¡æ¯ã€æ•°æ®åˆ é™¤ï¼Œè€Œå…¶ä»–ä¸¤‹Æ¡compactionåˆ™ä¼šä¿ç•™˜q™äº›ä¿¡æ¯ã€æ•°æ®ï¼ˆmarkçš„åÅžå¼ï¼‰ã€‚Bigtableä¼šæ—¶ä¸æ—¶çš„æ‰«ææ‰€æœ‰çš„TabletåQŒåÆˆå¯¹å®ƒä»¬åšmajor compactionã€‚è¿™ä¸ªmajor compactionå¯ä»¥ž®†éœ€è¦åˆ é™¤çš„æ•°æ®çœŸæ£çš„åˆ é™¤ä»Žè€ŒèŠ‚çœç©ºé—ß_¼Œòq¶ä¿æŒç³»¾lŸä¸€è‡´æ€§ã€?/span>

SSTableçš„localityå’ŒIn Memory

åœ¨Bigtableä¸ï¼Œå®ƒçš„æœ¬åœ°æ€§æ˜¯ç”±Locality groupæ¥å®šä¹‰çš„åQŒå³å¤šä¸ªcolumn familyå¯ä»¥¾l„åˆåˆîC¸€ä¸ªlocality groupä¸ï¼Œåœ¨åŒä¸€ä¸ªTabletä¸ï¼Œä½¿ç”¨å•ç‹¬çš„SSTableå˜å‚¨˜q™äº›åœ¨åŒä¸€ä¸ªlocality groupçš„column familyã€‚HBaseæŠŠè¿™ä¸ªæ¨¡åž‹ç®€åŒ–äº†åQŒå³æ¯ä¸ªcolumn familyåœ¨æ¯ä¸ªHRegionéƒ½ä‹Éç”¨å•ç‹¬çš„HFileå˜å‚¨åQŒHFileæ²¡æœ‰locality groupçš„æ¦‚å¿µï¼Œæˆ–è€…ä¸€ä¸ªcolumn familyž®±æ˜¯ä¸€ä¸ªlocality groupã€?/span>

åœ¨Bigtableä¸ï¼Œ˜q˜å¯ä»¥æ”¯æŒåœ¨locality group¾U§åˆ«è®„¡½®æ˜¯å¦ž®†æ‰€æœ‰è¿™ä¸ªlocality groupçš„æ•°æ®åŠ è½½åˆ°å†…å˜ä¸ï¼Œåœ¨HBaseä¸é€šè¿‡column familyå®šä¹‰æ—¶è®¾¾|®ã€‚è¿™ä¸ªå†…å˜åŠ è½½é‡‡ç”¨åšgæ—¶åŠ è½½ï¼Œä¸»è¦åº”ç”¨äºŽä¸€äº›å°çš„column familyåQŒåÆˆä¸”ç»å¸¸è¢«ç”¨åˆ°çš„ï¼Œä»Žè€Œæå‡è¯»çš„æ€§èƒ½åQŒå› è€Œè¿™æ ·å°±ä¸éœ€è¦å†ä»Žç£ç›˜ä¸è¯Õd–äº†ã€?/span>

SSTableåŽ‹ç¾ƒ

Bigtableçš„åŽ‹¾~©æ˜¯åŸÞZºŽlocality group¾U§åˆ«åQ?br />

Compression

Clients can control whether or not the SSTables for a locality group are compressed, and if so, which compression format is used. The user-specified compression format is applied to each SSTable block (whose size is controllable via a locality group specific tuning parameter). Although we lose some space by compressing each block separately, we benefit in that small portions of an SSTable can be read without decompressing the entire file. Many clients use a two-pass custom compression scheme. The first pass uses Bentley and McIlroy’s scheme [6], which compresses long common strings across a large window. The second pass uses a fast compression algorithm that looks for repetitions in a small 16 KB window of the data. Both compression passes are very fast—they encode at 100–200 MB/s, and decode at 400–1000 MB/s on modern machines.

Bigtableçš„åŽ‹¾~©ä»¥SSTableä¸çš„ä¸€ä¸ªBlockä¸ºå•ä½ï¼Œè™½ç„¶æ¯ä¸ªBlockä¸ºåŽ‹¾~©å•ä½æŸå¤×ƒ¸€äº›ç©ºé—ß_¼Œä½†æ˜¯é‡‡ç”¨˜q™ç§æ–¹å¼åQŒæˆ‘ä»¬å¯ä»¥ä»¥Blockä¸ºå•ä½è¯»å–ã€è§£åŽ‹ã€åˆ†æžï¼Œè€Œä¸æ˜¯æ¯‹Æ¡ä»¥ä¸€ä¸?#8220;å¤?#8221;çš„SSTableä¸ºå•ä½è¯»å–ã€è§£åŽ‹ã€åˆ†æžã€?/span>

SSTableçš„è¯»¾~“å˜

ä¸ÞZº†æå‡è¯Èš„æ€§èƒ½åQŒBigtableé‡‡ç”¨ä¸¤å±‚¾~“å˜æœºåˆ¶åQ?br />

Caching for read performance

To improve read performance, tablet servers use two levels of caching. The Scan Cache is a higher-level cache that caches the key-value pairs returned by the SSTable interface to the tablet server code. The Block Cache is a lower-level cache that caches SSTables blocks that were read from GFS. The Scan Cache is most useful for applications that tend to read the same data repeatedly. The Block Cache is useful for applications that tend to read data that is close to the data they recently read (e.g., sequential reads, or random reads of different columns in the same locality group within a hot row).

ä¸¤å±‚¾~“å˜åˆ†åˆ«æ˜¯ï¼š
1. High LevelåQŒç¼“å˜ä»ŽSSTableè¯Õd–çš„Key/Valueå¯V€‚æå‡é‚£äº›å€‘Ö‘é‡å¤çš„è¯»å–ç›¸åŒçš„æ•°æ®çš„æ“ä½œï¼ˆå¼•ç”¨å±€éƒ¨æ€§åŽŸç†ï¼‰ã€?br />2. Low LevelåQŒBlockCacheåQŒç¼“å˜SSTableä¸çš„Blockã€‚æå‡é‚£äº›å€‘Ö‘äºŽè¯»å–ç›¸˜q‘æ•°æ®çš„æ“ä½œã€?br />

Bloom Filter

å‰æ–‡æœ‰æåˆ°Bigtableé‡‡ç”¨åˆåÆˆè¯»ï¼Œå³éœ€è¦è¯»å–æ¯ä¸ªSSTableä¸çš„ç›¸å…³æ•°æ®åQŒåÆˆåˆåÆˆæˆä¸€ä¸ªç»“æžœè¿”å›žï¼Œç„¶è€Œæ¯‹Æ¡è¯»éƒ½éœ€è¦è¯»å–æ‰€æœ‰SSTableåQŒè‡ªç„¶ä¼šè€—è´¹æ€§èƒ½åQŒå› è€Œå¼•å…¥äº†Bloom FilteråQŒå®ƒå¯ä»¥å¾ˆå¿«é€Ÿçš„æ‰‘Öˆ°ä¸€ä¸ªRowKeyä¸åœ¨æŸä¸ªSSTableä¸çš„äº‹å®žåQˆæ³¨åQšå˜q‡æ¥åˆ™ä¸æˆç«‹åQ‰ã€?br />

Bloom Filter

As described in Section 5.3, a read operation has to read from all SSTables that make up the state of a tablet. If these SSTables are not in memory, we may end up doing many disk accesses. We reduce the number of accesses by allowing clients to specify that Bloom fil- ters [7] should be created for SSTables in a particu- lar locality group. A Bloom filter allows us to ask whether an SSTable might contain any data for a spec- ified row/column pair. For certain applications, a small amount of tablet server memory used for storing Bloom filters drastically reduces the number of disk seeks re- quired for read operations. Our use of Bloom filters also implies that most lookups for non-existent rows or columns do not need to touch disk.

SSTableè®¾è®¡æˆImmutableçš„å¥½å¤?/h2>åœ¨SSTableå®šä¹‰ä¸å°±æœ‰æåˆ°SSTableæ˜¯ä¸€ä¸ªImmutableçš„order mapåQŒè¿™ä¸ªImmutableçš„è®¾è®¡å¯ä»¥è®©¾pÈ»Ÿ½Ž€å•å¾ˆå¤šï¼š
Exploiting Immutability

Besides the SSTable caches, various other parts of the Bigtable system have been simplified by the fact that all of the SSTables that we generate are immutable. For example, we do not need any synchronization of accesses to the file system when reading from SSTables. As a result, concurrency control over rows can be implemented very efficiently. The only mutable data structure that is accessed by both reads and writes is the memtable. To reduce contention during reads of the memtable, we make each memtable row copy-on-write and allow reads and writes to proceed in parallel.
Since SSTables are immutable, the problem of permanently removing deleted data is transformed to garbage collecting obsolete SSTables. Each tablet’s SSTables are registered in the METADATA table. The master removes obsolete SSTables as a mark-and-sweep garbage collection [25] over the set of SSTables, where the METADATA table contains the set of roots.

Finally, the immutability of SSTables enables us to split tablets quickly. Instead of generating a new set of SSTables for each child tablet, we let the child tablets share the SSTables of the parent tablet.

å…³äºŽImmutableçš„ä¼˜ç‚ÒŽœ‰ä»¥ä¸‹å‡ ç‚¹åQ?/span>
1. åœ¨è¯»SSTableæ˜¯ä¸éœ€è¦åŒæ¥ã€‚è¯»å†™åŒæ¥åªéœ€è¦åœ¨memtableä¸å¤„ç†ï¼Œä¸ÞZº†å‡å°‘memtableçš„è¯»å†™ç«žäº‰ï¼ŒBigtablež®†memtableçš„rowè®¾è®¡æˆcopy-on-writeåQŒä»Žè€Œè¯»å†™å¯ä»¥åŒæ—¶è¿›è¡Œã€?/span>
2. æ°æ€¹…çš„ç§»é™¤æ•°æ®è{å˜äØ“SSTableçš„Garbage Collectã€‚æ¯ä¸ªTabletä¸çš„SSTableåœ¨METADATAè¡¨ä¸æœ‰æ³¨å†Œï¼Œmasterä½¿ç”¨mark-and-sweep½Ž—æ³•ž®†SSTableåœ¨GC˜q‡ç¨‹ä¸ç§»é™¤ã€?/span>
3. å¯ä»¥è®©Tablet Split˜q‡ç¨‹å˜çš„é«˜æ•ˆåQŒæˆ‘ä»¬ä¸éœ€è¦äØ“æ¯ä¸ªåTabletåˆ›å¾æ–°çš„SSTableåQŒè€Œæ˜¯å¯ä»¥å…×ƒínçˆ?/span>Tabletçš„SSTableã€?/span>

DLevin 2015-09-25 01:35 å‘è¡¨è¯„è®º
]]>æ·±å…¥HBaseæž¶æž„è§£æžåQˆäºŒåQ?/title><link>http://www.aygfsteel.com/DLevin/archive/2015/08/22/426950.html</link><dc:creator>DLevin</dc:creator><author>DLevin</author><pubDate>Sat, 22 Aug 2015 11:40:00 GMT</pubDate><guid>http://www.aygfsteel.com/DLevin/archive/2015/08/22/426950.html</guid><wfw:comment>http://www.aygfsteel.com/DLevin/comments/426950.html</wfw:comment><comments>http://www.aygfsteel.com/DLevin/archive/2015/08/22/426950.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.aygfsteel.com/DLevin/comments/commentRss/426950.html</wfw:commentRss><trackback:ping>http://www.aygfsteel.com/DLevin/services/trackbacks/426950.html</trackback:ping><description><![CDATA[<h2> å‰è¨€</h2>˜q™æ˜¯<a href="http://www.aygfsteel.com/DLevin/archive/2015/08/22/426877.html">ã€Šæ·±å…¥HBaseæž¶æž„è§£æžåQˆä¸€åQ‰ã€?/a>çš„ç®‹åQŒä¸å¤šåºŸè¯ï¼Œ¾l§ç®‹ã€‚ã€‚ã€‚ã€?br /><h2>HBaseè¯Èš„å®žçŽ°</h2>é€šè¿‡å‰æ–‡çš„æ˜qŽÍ¼Œæˆ‘ä»¬çŸ¥é“åœ¨HBaseå†™æ—¶åQŒç›¸åŒCell(RowKey/ColumnFamily/Columnç›¸åŒ)òq¶ä¸ä¿è¯åœ¨ä¸€èµøP¼Œç”šè‡³åˆ é™¤ä¸€ä¸ªCellä¹Ÿåªæ˜¯å†™å…¥ä¸€ä¸ªæ–°çš„CellåQŒå®ƒå«æœ‰Deleteæ ‡è®°åQŒè€Œä¸ä¸€å®šå°†ä¸€ä¸ªCellçœŸæ£åˆ é™¤äº†ï¼Œå› è€Œè¿™ž®±å¼•èµ·äº†ä¸€ä¸ªé—®é¢˜ï¼Œå¦‚ä½•å®žçŽ°è¯Èš„é—®é¢˜åQŸè¦è§£å†³˜q™ä¸ªé—®é¢˜åQŒæˆ‘ä»¬å…ˆæ¥åˆ†æžä¸€ä¸‹ç›¸åŒçš„Cellå¯èƒ½å˜åœ¨çš„ä½¾|®ï¼šé¦–å…ˆå¯ÒŽ–°å†™å…¥çš„CellåQŒå®ƒä¼šå˜åœ¨äºŽMemStoreä¸ï¼›ç„¶åŽå¯¹ä¹‹å‰å·²¾lFlushåˆ°HDFSä¸çš„CellåQŒå®ƒä¼šå˜åœ¨äºŽæŸä¸ªæˆ–æŸäº›StoreFile(HFile)ä¸ï¼›æœ€åŽï¼Œå¯¹åˆšè¯Õd–˜q‡çš„CellåQŒå®ƒå¯èƒ½å˜åœ¨äºŽBlockCacheä¸ã€‚æ—¢ç„¶ç›¸åŒçš„Cellå¯èƒ½å˜å‚¨åœ¨ä¸‰ä¸ªåœ°æ–¹ï¼Œåœ¨è¯»å–çš„æ—¶å€™åªéœ€è¦æ‰«çž„è¿™ä¸‰ä¸ªåœ°æ–¹åQŒç„¶åŽå°†¾l“æžœåˆåÆˆå›_¯(Merge Read)åQŒåœ¨HBaseä¸æ‰«çž„çš„™åºåºä¾æ¬¡æ˜¯ï¼šBlockCacheã€MemStoreã€StoreFile(HFile)ã€‚å…¶ä¸StoreFileçš„æ‰«çž„å…ˆä¼šä‹Éç”¨Bloom Filter˜q‡æ×oé‚£äº›ä¸å¯èƒ½ç¬¦åˆæ¡ä»¶çš„HFileåQŒç„¶åŽä‹Éç”¨Block Indexå¿«é€Ÿå®šä½CellåQŒåÆˆž®†å…¶åŠ è²åˆ°BlockCacheä¸ï¼Œç„¶åŽä»ŽBlockCacheä¸è¯»å–ã€‚æˆ‘ä»¬çŸ¥é“ä¸€ä¸ªHStoreå¯èƒ½å˜åœ¨å¤šä¸ªStoreFile(HFile)åQŒæ¤æ—‰™œ€è¦æ‰«çž„å¤šä¸ªHFileåQŒå¦‚æžœHFile˜q‡å¤šåˆæ˜¯ä¼šå¼•èµäh€§èƒ½é—®é¢˜ã€?br /><img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig16.png" height="278" width="769" /><br /><h2>Compaction</h2>MemStoreæ¯æ¬¡Flushä¼šåˆ›å»ºæ–°çš„HFileåQŒè€Œè¿‡å¤šçš„HFileä¼šå¼•èµ¯‚¯»çš„æ€§èƒ½é—®é¢˜åQŒé‚£ä¹ˆå¦‚ä½•è§£å†Œ™¿™ä¸ªé—®é¢˜å‘¢åQŸHBaseé‡‡ç”¨Compactionæœºåˆ¶æ¥è§£å†Œ™¿™ä¸ªé—®é¢˜ï¼Œæœ‰ç‚¹¾cÖM¼¼Javaä¸çš„GCæœºåˆ¶åQŒè“våˆJavaä¸åœçš„ç”³è¯·å†…å˜è€Œä¸é‡Šæ”¾åQŒå¢žåŠ æ€§èƒ½åQŒç„¶è€Œå¤©ä¸‹æ²¡æœ‰å…è´¹çš„åˆé¤åQŒæœ€¾lˆæˆ‘ä»¬è¿˜æ˜¯è¦åœ¨æŸä¸ªæ¡ä»¶ä¸‹åŽÀL”¶é›†åžƒåœ¾ï¼Œå¾ˆå¤šæ—¶å€™éœ€è¦Stop-The-WorldåQŒè¿™¿UStop-The-Worldæœ‰äº›æ—¶å€™ä¹Ÿä¼šå¼•èµ·å¾ˆå¤§çš„é—®é¢˜åQŒæ¯”å¦‚å‚è€ƒæœ¬äººå†™çš?a href="http://www.aygfsteel.com/DLevin/archive/2015/08/01/426418.html">˜q™ç¯‡æ–‡ç« </a>åQŒå› è€Œè®¾è®¡æ˜¯ä¸€¿Uæƒè¡¡ï¼Œæ²¡æœ‰å®Œç¾Žçš„ã€‚è¿˜æ˜¯ç±»ä¼¼Javaä¸çš„GCåQŒåœ¨HBaseä¸Compactionåˆ†äØ“ä¸¤ç§åQšMinor Compactionå’ŒMajor Compactionã€?br /><ol><li>Minor Compactionæ˜¯æŒ‡é€‰å–ä¸€äº›å°çš„ã€ç›¸é‚Èš„StoreFilež®†ä»–ä»¬åˆòq¶æˆä¸€ä¸ªæ›´å¤§çš„StoreFileåQŒåœ¨˜q™ä¸ª˜q‡ç¨‹ä¸ä¸ä¼šå¤„ç†å·²¾lDeletedæˆ–Expiredçš„Cellã€‚ä¸€‹Æ¡Minor Compactionçš„ç»“æžœæ˜¯æ›´å°‘òq¶ä¸”æ›´å¤§çš„StoreFileã€‚ï¼ˆ˜q™ä¸ªæ˜¯å¯¹çš„å—åQŸBigTableä¸æ˜¯˜q™æ ·æè¿°Minor Compactionçš?span style="font-size: 10.000000pt; font-family: 'Times'">åQšAs write operations execute, the size of the memtable in- creases. When the memtable size reaches a threshold, the memtable is frozen, a new memtable is created, and the frozen memtable is converted to an SSTable and written to GFS. This </span><span style="font-size: 10.000000pt; font-family: 'Times'; font-style: italic">minor compaction </span><span style="font-size: 10.000000pt; font-family: 'Times'">process has two goals: it shrinks the memory usage of the tablet server, and it reduces the amount of data that has to be read from the commit log during recovery if this server dies. Incom- ing read and write operations can continue while com- pactions occur. </span>ä¹Ÿå°±æ˜¯è¯´å®ƒå°†memtableçš„æ•°æ®flushçš„ä¸€ä¸ªHFile/SSTable¿UîCØ“ä¸€‹Æ¡Minor CompactionåQ?/li><li>Major Compactionæ˜¯æŒ‡ž®†æ‰€æœ‰çš„StoreFileåˆåÆˆæˆä¸€ä¸ªStoreFileåQŒåœ¨˜q™ä¸ª˜q‡ç¨‹ä¸ï¼Œæ ‡è®°ä¸ºDeletedçš„Cellä¼šè¢«åˆ é™¤åQŒè€Œé‚£äº›å·²¾lExpiredçš„Cellä¼šè¢«ä¸¢å¼ƒåQŒé‚£äº›å·²¾lè¶…˜q‡æœ€å¤šç‰ˆæœ¬æ•°çš„Cellä¼šè¢«ä¸¢å¼ƒã€‚ä¸€‹Æ¡Major Compactionçš„ç»“æžœæ˜¯ä¸€ä¸ªHStoreåªæœ‰ä¸€ä¸ªStoreFileå˜åœ¨ã€‚Major Compactionå¯ä»¥æ‰‹åŠ¨æˆ–è‡ªåŠ¨è§¦å‘ï¼Œç„¶è€Œç”±äºŽå®ƒä¼šå¼•èµ·å¾ˆå¤šçš„IOæ“ä½œè€Œå¼•èµäh€§èƒ½é—®é¢˜åQŒå› è€Œå®ƒä¸€èˆ¬ä¼šè¢«å®‰æŽ’åœ¨å‘¨æœ«ã€å‡Œæ™¨ç‰é›†ç¾¤æ¯”è¾ƒé—²çš„æ—‰™—´ã€?br /></li></ol>æ›´åÅžè±¡ä¸€ç‚¹ï¼Œå¦‚ä¸‹é¢ä¸¤å¼ å›¾åˆ†åˆ«è¡¨ç¤ºMinor Compactionå’ŒMajor Compactionã€?br /><img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig18.png" height="329" width="723" /><img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig19.png" height="339" width="653" /><br /><h2>HRegion Split</h2>æœ€åˆï¼Œä¸€ä¸ªTableåªæœ‰ä¸€ä¸ªHRegionåQŒéšç€æ•°æ®å†™å…¥å¢žåŠ åQŒå¦‚æžœä¸€ä¸ªHRegionåˆ°è¾¾ä¸€å®šçš„å¤§å°åQŒå°±éœ€è¦Splitæˆä¸¤ä¸ªHRegionåQŒè¿™ä¸ªå¤§ž®ç”±hbase.hregion.max.filesizeæŒ‡å®šåQŒé»˜è®¤äØ“10GBã€‚å½“splitæ—Óž¼Œä¸¤ä¸ªæ–°çš„HRegionä¼šåœ¨åŒä¸€ä¸ªHRegionServerä¸åˆ›å»ºï¼Œå®ƒä»¬å„è‡ªåŒ…å«çˆ¶HRegionä¸€åŠçš„æ•°æ®åQŒå½“Splitå®ŒæˆåŽï¼Œçˆ¶HRegionä¼šä¸‹¾U¿ï¼Œè€Œæ–°çš„ä¸¤ä¸ªåHRegionä¼šå‘HMasteræ³¨å†Œä¸Šçº¿åQŒå¤„äºŽè´Ÿè½½å‡è¡¡çš„è€ƒè™‘åQŒè¿™ä¸¤ä¸ªæ–°çš„HRegionå¯èƒ½ä¼šè¢«HMasteråˆ†é…åˆ°å…¶ä»–çš„HRegionServerä¸ã€‚å…³äºŽSplitçš„è¯¦¾l†ä¿¡æ¯ï¼Œå¯ä»¥å‚è€ƒè¿™½‹‡æ–‡ç« ï¼š<a >ã€ŠApache HBase Region Splitting and Mergingã€?/a>ã€?br /><img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig21.png" height="361" width="675" /><br /><h2>HRegionè´Ÿè²å‡è¡¡</h2>åœ¨HRegion SplitåŽï¼Œä¸¤ä¸ªæ–°çš„HRegionæœ€åˆä¼šå’Œä¹‹å‰çš„çˆ¶HRegionåœ¨ç›¸åŒçš„HRegionServerä¸Šï¼Œå‡ÞZºŽè´Ÿè²å‡è¡¡çš„è€ƒè™‘åQŒHMasterå¯èƒ½ä¼šå°†å…¶ä¸çš„ä¸€ä¸ªç”šè‡³ä¸¤ä¸ªé‡æ–°åˆ†é…çš„å…¶ä»–çš„HRegionServerä¸ï¼Œæ¤æ—¶ä¼šå¼•èµähœ‰äº›HRegionServerå¤„ç†çš„æ•°æ®åœ¨å…¶ä»–èŠ‚ç‚¹ä¸Šï¼Œç›´åˆ°ä¸‹ä¸€‹Æ¡Major Compactionž®†æ•°æ®ä»Ž˜qœç«¯çš„èŠ‚ç‚¹ç§»åŠ¨åˆ°æœ¬åœ°èŠ‚ç‚¹ã€?br /><br /><img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig22.png" height="358" width="714" /><br /><h2>HRegionServer Recovery</h2>å½“ä¸€å°HRegionServerå®•æœºæ—Óž¼Œç”×ƒºŽå®ƒä¸å†å‘é€Heartbeat¾l™ZooKeeperè€Œè¢«ç›‘æµ‹åˆŽÍ¼Œæ¤æ—¶ZooKeeperä¼šé€šçŸ¥HMasteråQŒHMasterä¼šæ£€‹¹‹åˆ°å“ªå°HRegionServerå®•æœºåQŒå®ƒž®†å®•æœºçš„HRegionServerä¸çš„HRegioné‡æ–°åˆ†é…¾l™å…¶ä»–çš„HRegionServeråQŒåŒæ—¶HMasterä¼šæŠŠå®•æœºçš„HRegionServerç›¸å…³çš„WALæ‹†åˆ†åˆ†é…¾l™ç›¸åº”çš„HRegionServer(ž®†æ‹†åˆ†å‡ºçš„WALæ–‡äšgå†™å…¥å¯¹åº”çš„ç›®çš„HRegionServerçš„WALç›®å½•ä¸ï¼Œòq¶åÆˆå†™å…¥å¯¹åº”çš„DataNodeä¸ï¼‰åQŒä»Žè€Œè¿™äº›HRegionServerå¯ä»¥Replayåˆ†åˆ°çš„WALæ¥é‡å»ºMemStoreã€?br /><img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig25.png" height="368" width="708" /><br /><img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig26.png" height="378" width="724" /><br /><h2>HBaseæž¶æž„½Ž€å•æ€È»“</h2>åœ¨NoSQLä¸ï¼Œå˜åœ¨è‘—åçš„CAPç†è®ºåQŒå³Consistencyã€Availabilityã€Partition Toleranceä¸å¯å…¨å¾—åQŒç›®å‰å¸‚åœÞZ¸ŠåŸºæœ¬ä¸Šçš„NoSQLéƒ½é‡‡ç”¨Partition Toleranceä»¥å®žçŽ°æ•°æ®å¾—æ°´åã^æ‰©å±•åQŒæ¥å¤„ç†Relational DataBaseé‡åˆ°çš„æ— æ³•å¤„ç†æ•°æ®é‡å¤ªå¤§çš„é—®é¢˜ï¼Œæˆ–å¼•èµïLš„æ€§èƒ½é—®é¢˜ã€‚å› è€Œåªæœ‰å‰©ä¸‹Cå’ŒAå¯ä»¥é€‰æ‹©ã€‚HBaseåœ¨ä¸¤è€…ä¹‹é—´é€‰æ‹©äº†ConsistencyåQŒç„¶åŽä‹Éç”¨å¤šä¸ªHMasterä»¥åŠæ”¯æŒHRegionServerçš„failureç›‘æŽ§ã€ZooKeeperå¼•å…¥ä½œäØ“åè°ƒè€…ç‰å„ç§æ‰‹æ®µæ¥è§£å†³Availabilityé—®é¢˜åQŒç„¶è€Œå½“¾|‘ç»œçš„Split-Brain(Network Partition)å‘ç”Ÿæ—Óž¼Œå®ƒè¿˜æ˜¯æ— æ³•å®Œå…¨è§£å†³Availabilityçš„é—®é¢˜ã€‚ä»Ž˜q™ä¸ªè§’åº¦ä¸Šï¼ŒCassandraé€‰æ‹©äº†AåQŒå³å®ƒåœ¨¾|‘ç»œSplit-Brainæ—¶è¿˜æ˜¯èƒ½æ£å¸¸å†™ï¼Œè€Œä‹Éç”¨å…¶ä»–æŠ€æœ¯æ¥è§£å†³Consistencyçš„é—®é¢˜ï¼Œå¦‚è¯»çš„æ—¶å€™è§¦å‘Consistencyåˆ¤æ–å’Œå¤„ç†ã€‚è¿™æ˜¯è®¾è®¡ä¸Šçš„é™åˆ¶ã€?br /><br />ä»Žå®žçŽîC¸Šçš„ä¼˜ç‚¹ï¼š<br /><ol><li>HBaseé‡‡ç”¨å¼ÞZ¸€è‡´æ€§æ¨¡åž‹ï¼Œåœ¨ä¸€ä¸ªå†™˜q”å›žåŽï¼Œä¿è¯æ‰€æœ‰çš„è¯»éƒ½è¯Õdˆ°ç›¸åŒçš„æ•°æ®ã€?/li><li>é€šè¿‡HRegionåŠ¨æ€Splitå’ŒMergeå®žçŽ°è‡ªåŠ¨æ‰©å±•åQŒåÆˆä½¿ç”¨HDFSæä¾›çš„å¤šä¸ªæ•°æ®å¤‡ä»½åŠŸèƒ½ï¼Œå®žçŽ°é«˜å¯ç”¨æ€§ã€?/li><li>é‡‡ç”¨HRegionServerå’ŒDataNode˜qè¡Œåœ¨ç›¸åŒçš„æœåŠ¡å™¨ä¸Šå®žçŽ°æ•°æ®çš„æœ¬åœ°åŒ–åQŒæå‡è¯»å†™æ€§èƒ½åQŒåÆˆå‡å°‘¾|‘ç»œåŽ‹åŠ›ã€?/li><li>å†…å¾HRegionServerçš„å®•æœø™‡ªåŠ¨æ¢å¤ã€‚é‡‡ç”¨WALæ¥Replay˜q˜æœªæŒä¹…åŒ–åˆ°HDFSçš„æ•°æ®ã€?/li><li>å¯ä»¥æ— ç¼çš„å’ŒHadoop/MapReduceé›†æˆã€?br /></li></ol>å®žçŽ°ä¸Šçš„¾~ºç‚¹åQ?br /><ol><li>WALçš„Replay˜q‡ç¨‹å¯èƒ½ä¼šå¾ˆæ…¢ã€?/li><li>çùNš¾æ¢å¤æ¯”è¾ƒå¤æ‚åQŒä¹Ÿä¼šæ¯”è¾ƒæ…¢ã€?/li><li>Major Compactionä¼šå¼•èµ·IO Stormã€?/li><li>ã€‚ã€‚ã€‚ã€?br /></li></ol><h2>å‚è€ƒï¼š</h2> https://www.mapr.com/blog/in-depth-look-hbase-architecture#.VdNSN6Yp3qx<br /> http://jimbojw.com/wiki/index.php?title=Understanding_Hbase_and_BigTable<br /> http://hbase.apache.org/book.html <br /> http://www.searchtb.com/2011/01/understanding-hbase.html <br /> http://research.google.com/archive/bigtable-osdi06.pdf<img src ="http://www.aygfsteel.com/DLevin/aggbug/426950.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.aygfsteel.com/DLevin/" target="_blank">DLevin</a> 2015-08-22 19:40 <a href="http://www.aygfsteel.com/DLevin/archive/2015/08/22/426950.html#Feedback" target="_blank" style="text-decoration:none;">å‘è¡¨è¯„è®º</a></div>]]></description></item><item><title>æ·±å…¥HBaseæž¶æž„è§£æžåQˆä¸€åQ?/title><link>http://www.aygfsteel.com/DLevin/archive/2015/08/22/426877.html</link><dc:creator>DLevin</dc:creator><author>DLevin</author><pubDate>Sat, 22 Aug 2015 09:44:00 GMT</pubDate><guid>http://www.aygfsteel.com/DLevin/archive/2015/08/22/426877.html</guid><wfw:comment>http://www.aygfsteel.com/DLevin/comments/426877.html</wfw:comment><comments>http://www.aygfsteel.com/DLevin/archive/2015/08/22/426877.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.aygfsteel.com/DLevin/comments/commentRss/426877.html</wfw:commentRss><trackback:ping>http://www.aygfsteel.com/DLevin/services/trackbacks/426877.html</trackback:ping><description><![CDATA[<h2>å‰è®°</h2> å…¬å¸å†…éƒ¨ä½¿ç”¨çš„æ˜¯MapRç‰ˆæœ¬çš„Hadoopç”Ÿæ€ç³»¾lŸï¼Œå› è€Œä»ŽMapRçš„å®˜¾|‘çœ‹åˆîCº†˜q™ç¯‡æ–‡æ–‡ç« ï¼š<a >An In-Depth Look at the HBase Architecture</a>åQŒåŽŸæœ¬æƒ³¾˜»è¯‘å…¨æ–‡åQŒç„¶è€Œå¦‚æžœç¿»è¯‘å°±éœ€è¦å„¿Uå’¬æ–‡åš¼å—ï¼Œå¤ªéº»çƒ¦ï¼Œå› è€Œæœ¬æ–‡å¤§éƒ¨åˆ†ä½¿ç”¨äº†è‡ªå·Þqš„è¯è¨€åQŒåÆˆä¸”åŠ å…¥äº†å…¶ä»–èµ„æºçš„å‚è€ƒç†è§£ä»¥åŠæœ¬äºø™‡ªå·Þp¯»æºç æ—¶å¯¹å…¶çš„ç†è§£åQŒå±žäºŽåŠ¾˜»è¯‘ã€åŠåŽŸåˆ›å§ã€?br /> <h2>HBaseæž¶æž„¾l„æˆ</h2> HBaseé‡‡ç”¨Master/Slaveæž¶æž„æå¾é›†ç¾¤åQŒå®ƒéš¶å±žäºŽHadoopç”Ÿæ€ç³»¾lŸï¼Œç”×ƒ¸€ä¸‹ç±»åž‹èŠ‚ç‚¹ç»„æˆï¼šHMasterèŠ‚ç‚¹ã€HRegionServerèŠ‚ç‚¹ã€ZooKeeperé›†ç¾¤åQŒè€Œåœ¨åº•å±‚åQŒå®ƒž®†æ•°æ®å˜å‚¨äºŽHDFSä¸ï¼Œå› è€Œæ¶‰åŠåˆ°HDFSçš„NameNodeã€DataNode½{‰ï¼Œæ€ÖM½“¾l“æž„å¦‚ä¸‹åQ?br /> <img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArch1.jpg" height="389" width="603" /><br /> å…¶ä¸<strong>HMasterèŠ‚ç‚¹</strong>ç”¨äºŽåQ?br /> <ol> <li>½Ž¡ç†HRegionServeråQŒå®žçŽ°å…¶è´Ÿè²å‡è¡¡ã€?/li> <li>½Ž¡ç†å’Œåˆ†é…HRegionåQŒæ¯”å¦‚åœ¨HRegion splitæ—¶åˆ†é…æ–°çš„HRegionåQ›åœ¨HRegionServeré€€å‡ºæ—¶˜qç§»å…¶å†…çš„HRegionåˆ°å…¶ä»–HRegionServerä¸Šã€?/li> <li>å®žçŽ°DDLæ“ä½œåQˆData Definition LanguageåQŒnamespaceå’Œtableçš„å¢žåˆ æ”¹åQŒcolumn familiyçš„å¢žåˆ æ”¹½{‰ï¼‰ã€?/li> <li>½Ž¡ç†namespaceå’Œtableçš„å…ƒæ•°æ®åQˆå®žé™…å˜å‚¨åœ¨HDFSä¸Šï¼‰ã€?/li> <li>æƒé™æŽ§åˆ¶åQˆACLåQ‰ã€?/li> </ol> <strong>HRegionServerèŠ‚ç‚¹</strong>ç”¨äºŽåQ?br /> <ol> <li>å˜æ”¾å’Œç®¡ç†æœ¬åœ°HRegionã€?/li> <li>è¯Õd†™HDFSåQŒç®¡ç†Tableä¸çš„æ•°æ®ã€?/li> <li>Clientç›´æŽ¥é€šè¿‡HRegionServerè¯Õd†™æ•°æ®åQˆä»ŽHMasterä¸èŽ·å–å…ƒæ•°æ®åQŒæ‰¾åˆ°RowKeyæ‰€åœ¨çš„HRegion/HRegionServeråŽï¼‰ã€?/li> </ol> <strong>ZooKeeperé›†ç¾¤æ˜¯åè°ƒç³»¾l?/strong>åQŒç”¨äºŽï¼š<br /> <ol> <li>å˜æ”¾æ•´ä¸ª HBaseé›†ç¾¤çš„å…ƒæ•°æ®ä»¥åŠé›†ç¾¤çš„çŠ¶æ€ä¿¡æ¯ã€?/li> <li>å®žçŽ°HMasterä¸ÖM»ŽèŠ‚ç‚¹çš„failoverã€?/li> </ol> HBase Clienté€šè¿‡RPCæ–¹å¼å’ŒHMasterã€HRegionServeré€šä¿¡åQ›ä¸€ä¸ªHRegionServerå¯ä»¥å˜æ”¾1000ä¸ªHRegionåQ›åº•å±‚Tableæ•°æ®å˜å‚¨äºŽHDFSä¸ï¼Œè€ŒHRegionæ‰€å¤„ç†çš„æ•°æ®å°½é‡å’Œæ•°æ®æ‰€åœ¨çš„DataNodeåœ¨ä¸€èµøP¼Œå®žçŽ°æ•°æ®çš„æœ¬åœ°åŒ–åQ›æ•°æ®æœ¬åœ°åŒ–òq¶ä¸æ˜¯æ€»èƒ½å®žçŽ°åQŒæ¯”å¦‚åœ¨HRegion¿UÕdŠ¨(å¦‚å› Split)æ—Óž¼Œéœ€è¦ç‰ä¸‹ä¸€‹Æ¡Compactæ‰èƒ½¾l§ç®‹å›žåˆ°æœ¬åœ°åŒ–ã€?br /> <br /> æœ¬ç€åŠç¿»è¯‘çš„åŽŸåˆ™åQŒå†è´´ä¸€ä¸ªã€ŠAn In-Depth Look At The HBase Architectureã€‹çš„æž¶æž„å›¾ï¼š<br /> <img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig1.png" height="343" width="632" /><br /> ˜q™ä¸ªæž¶æž„å›¾æ¯”è¾ƒæ¸…æ™°çš„è¡¨è¾¾äº†HMasterå’ŒNameNodeéƒ½æ”¯æŒå¤šä¸ªçƒå¤‡ä†¾åQŒä‹Éç”¨ZooKeeperæ¥åšåè°ƒåQ›ZooKeeperòq¶ä¸æ˜¯äº‘èˆ¬ç¥ž¿U˜ï¼Œå®ƒä¸€èˆ¬ç”±ä¸‰å°æœºå™¨¾l„æˆä¸€ä¸ªé›†¾Ÿ¤ï¼Œå†…éƒ¨ä½¿ç”¨PAXOS½Ž—æ³•æ”¯æŒä¸‰å°Serverä¸çš„ä¸€å°å®•æœºï¼Œä¹Ÿæœ‰ä½¿ç”¨äº”å°æœºå™¨çš„ï¼Œæ¤æ—¶åˆ™å¯ä»¥æ”¯æŒåŒæ—¶ä¸¤å°å®•æœºï¼Œæ—¢å°‘äºŽåŠæ•°çš„å®•æœºåQŒç„¶è€Œéšç€æœºå™¨çš„å¢žåŠ ï¼Œå®ƒçš„æ€§èƒ½ä¹Ÿä¼šä¸‹é™åQ›RegionServerå’ŒDataNodeä¸€èˆ¬ä¼šæ”‘Öœ¨ç›¸åŒçš„Serverä¸Šå®žçŽ°æ•°æ®çš„æœ¬åœ°åŒ–ã€?br /> <h2>HRegion</h2> HBaseä½¿ç”¨RowKeyž®†è¡¨æ°´åã^åˆ‡å‰²æˆå¤šä¸ªHRegionåQŒä»ŽHMasterçš„è§’åº¦ï¼Œæ¯ä¸ªHRegionéƒ½çºªå½•äº†å®ƒçš„StartKeyå’ŒEndKeyåQˆç¬¬ä¸€ä¸ªHRegionçš„StartKeyä¸ºç©ºåQŒæœ€åŽä¸€ä¸ªHRegionçš„EndKeyä¸ºç©ºåQ‰ï¼Œç”×ƒºŽRowKeyæ˜¯æŽ’åºçš„åQŒå› è€ŒClientå¯ä»¥é€šè¿‡HMasterå¿«é€Ÿçš„å®šä½æ¯ä¸ªRowKeyåœ¨å“ªä¸ªHRegionä¸ã€‚HRegionç”±HMasteråˆ†é…åˆ°ç›¸åº”çš„HRegionServerä¸ï¼Œç„¶åŽç”±HRegionServerè´Ÿè´£HRegionçš„å¯åŠ¨å’Œ½Ž¡ç†åQŒå’ŒClientçš„é€šä¿¡åQŒè´Ÿè´£æ•°æ®çš„è¯?ä½¿ç”¨HDFS)ã€‚æ¯ä¸ªHRegionServerå¯ä»¥åŒæ—¶½Ž¡ç†1000ä¸ªå·¦å³çš„HRegionåQˆè¿™ä¸ªæ•°å—æ€Žä¹ˆæ¥çš„åQŸæ²¡æœ‰ä»Žä»£ç ä¸çœ‹åˆ°é™åˆÓž¼ŒéšùN“æ˜¯å‡ºäºŽç»éªŒï¼Ÿ‘…è¿‡1000ä¸ªä¼šå¼•è“væ€§èƒ½é—®é¢˜åQ?strong>æ¥å›ž½{”è¿™ä¸ªé—®é¢?/strong>åQšæ„Ÿè§‰è¿™ä¸?000çš„æ•°å—æ˜¯ä»ŽBigTableçš„è®ºæ–‡ä¸æ¥çš„åQ? ImplementationèŠ‚ï¼‰åQšEach tablet server manages a set of tablets(typically we have somewhere between ten to a thousand tablets per tablet server)åQ‰ã€?br /> <img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig2.png" height="337" width="724" /><br /> <h2>HMaster</h2> HMasteræ²¡æœ‰å•ç‚¹æ•…éšœé—®é¢˜åQŒå¯ä»¥å¯åŠ¨å¤šä¸ªHMasteråQŒé€šè¿‡ZooKeeperçš„Master Electionæœºåˆ¶ä¿è¯åŒæ—¶åªæœ‰ä¸€ä¸ªHMasterå‡ÞZºŽActiveçŠ¶æ€ï¼Œå…¶ä»–çš„HMasteråˆ™å¤„äºŽçƒå¤‡ä†¾çŠ¶æ€ã€‚ä¸€èˆ¬æƒ…å†µä¸‹ä¼šå¯åŠ¨ä¸¤ä¸ªHMasteråQŒéžActiveçš„HMasterä¼šå®šæœŸçš„å’ŒActive HMasteré€šä¿¡ä»¥èŽ·å–å…¶æœ€æ–°çŠ¶æ€ï¼Œä»Žè€Œä¿è¯å®ƒæ˜¯å®žæ—¶æ›´æ–°çš„åQŒå› è€Œå¦‚æžœå¯åŠ¨äº†å¤šä¸ªHMasteråè€Œå¢žåŠ äº†Active HMasterçš„è´Ÿæ‹…ã€‚å‰æ–‡å·²¾lä»‹¾lè¿‡äº†HMasterçš„ä¸»è¦ç”¨äºŽHRegionçš„åˆ†é…å’Œ½Ž¡ç†åQŒDDL(Data Definition LanguageåQŒæ—¢Tableçš„æ–°å»ºã€åˆ é™¤ã€ä¿®æ”¹ç‰)çš„å®žçŽ°ç‰åQŒæ—¢å®ƒä¸»è¦æœ‰ä¸¤æ–¹é¢çš„èŒè´£åQ?br /> <ol> <li>åè°ƒHRegionServer <ol> <li>å¯åŠ¨æ—¶HRegionçš„åˆ†é…ï¼Œä»¥åŠè´Ÿè²å‡è¡¡å’Œä¿®å¤æ—¶HRegionçš„é‡æ–°åˆ†é…ã€?/li> <li>ç›‘æŽ§é›†ç¾¤ä¸æ‰€æœ‰HRegionServerçš„çŠ¶æ€?é€šè¿‡Heartbeatå’Œç›‘å¬ZooKeeperä¸çš„çŠ¶æ€?ã€?br /> </li> </ol> </li> <li>AdminèŒèƒ½ <ol> <li>åˆ›å¾ã€åˆ é™¤ã€ä¿®æ”¹Tableçš„å®šä¹‰ã€?br /> </li> </ol> </li> </ol> <img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig3.png" /><br /> <h2> ZooKeeperåQšåè°ƒè€?/h2> ZooKeeperä¸ºHBaseé›†ç¾¤æä¾›åè°ƒæœåŠ¡åQŒå®ƒ½Ž¡ç†ç€HMasterå’ŒHRegionServerçš„çŠ¶æ€?available/alive½{?åQŒåÆˆä¸”ä¼šåœ¨å®ƒä»¬å®•æœºæ—¶é€šçŸ¥¾l™HMasteråQŒä»Žè€ŒHMasterå¯ä»¥å®žçŽ°HMasterä¹‹é—´çš„failoveråQŒæˆ–å¯¹å®•æœºçš„HRegionServerä¸çš„HRegioné›†åˆçš„ä¿®å¤?ž®†å®ƒä»¬åˆ†é…ç»™å…¶ä»–çš„HRegionServer)ã€‚ZooKeeperé›†ç¾¤æœ¬èínä½¿ç”¨ä¸€è‡´æ€§åè®?PAXOSåè®®)ä¿è¯æ¯ä¸ªèŠ‚ç‚¹çŠ¶æ€çš„ä¸€è‡´æ€§ã€?br /> <img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig4.png" height="318" width="703" /><br /> <h2>How The Components Work Together</h2> ZooKeeperåè°ƒé›†ç¾¤æ‰€æœ‰èŠ‚ç‚¹çš„å…×ƒínä¿¡æ¯åQŒåœ¨HMasterå’ŒHRegionServer˜qžæŽ¥åˆ°ZooKeeperåŽåˆ›å»ºEphemeralèŠ‚ç‚¹åQŒåÆˆä½¿ç”¨Heartbeatæœºåˆ¶¾l´æŒ˜q™ä¸ªèŠ‚ç‚¹çš„å˜‹zÈŠ¶æ€ï¼Œå¦‚æžœæŸä¸ªEphemeralèŠ‚ç‚¹å®žæ•ˆåQŒåˆ™HMasterä¼šæ”¶åˆ°é€šçŸ¥åQŒåÆˆåšç›¸åº”çš„å¤„ç†ã€?br /> <img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig5.png" height="329" width="722" /><br /> å¦å¤–åQŒHMasteré€šè¿‡ç›‘å¬ZooKeeperä¸çš„EphemeralèŠ‚ç‚¹(é»˜è®¤åQ?hbase/rs/)æ¥ç›‘æŽ§HRegionServerçš„åŠ å…¥å’Œå®•æœºã€‚åœ¨½W¬ä¸€ä¸ªHMaster˜qžæŽ¥åˆ°ZooKeeperæ—¶ä¼šåˆ›å¾EphemeralèŠ‚ç‚¹(é»˜è®¤åQ?hbasae/master)æ¥è¡¨½CºActiveçš„HMasteråQŒå…¶åŽåŠ ˜q›æ¥çš„HMasteråˆ™ç›‘å¬è¯¥EphemeralèŠ‚ç‚¹åQŒå¦‚æžœå½“å‰Activeçš„HMasterå®•æœºåQŒåˆ™è¯¥èŠ‚ç‚ÒŽ¶ˆå¤±ï¼Œå› è€Œå…¶ä»–HMasterå¾—åˆ°é€šçŸ¥åQŒè€Œå°†è‡ªèínè½¬æ¢æˆActiveçš„HMasteråQŒåœ¨å˜äØ“Activeçš„HMasterä¹‹å‰åQŒå®ƒä¼šåˆ›å»ºåœ¨/hbase/back-masters/ä¸‹åˆ›å»ø™‡ªå·Þqš„EphemeralèŠ‚ç‚¹ã€?br /> <h3> HBaseçš„ç¬¬ä¸€‹Æ¡è¯»å†?/h3> åœ¨HBase 0.96ä»¥å‰åQŒHBaseæœ‰ä¸¤ä¸ªç‰¹ŒDŠçš„TableåQ?ROOT-å’?META.åQˆå¦‚<a >BigTable</a>ä¸çš„è®¾è®¡åQ‰ï¼Œå…¶ä¸-ROOT- Tableçš„ä½¾|®å˜å‚¨åœ¨ZooKeeperåQŒå®ƒå˜å‚¨äº?META. Tableçš„RegionInfoä¿¡æ¯åQŒåÆˆä¸”å®ƒåªèƒ½å˜åœ¨ä¸€ä¸ªHRegionåQŒè€?META. Tableåˆ™å˜å‚¨äº†ç”¨æˆ·Tableçš„RegionInfoä¿¡æ¯åQŒå®ƒå¯ä»¥è¢«åˆ‡åˆ†æˆå¤šä¸ªHRegionåQŒå› è€Œå¯¹½W¬ä¸€‹Æ¡è®¿é—®ç”¨æˆ·Tableæ—Óž¼Œé¦–å…ˆä»ŽZooKeeperä¸è¯»å?ROOT- Tableæ‰€åœ¨HRegionServeråQ›ç„¶åŽä»Žè¯¥HRegionServerä¸æ ¹æ®è¯·æ±‚çš„TableNameåQŒRowKeyè¯Õd–.META. Tableæ‰€åœ¨HRegionServeråQ›æœ€åŽä»Žè¯¥HRegionServerä¸è¯»å?META. Tableçš„å†…å®¹è€ŒèŽ·å–æ¤‹Æ¡è¯·æ±‚éœ€è¦è®¿é—®çš„HRegionæ‰€åœ¨çš„ä½ç½®åQŒç„¶åŽè®¿é—®è¯¥HRegionSeverèŽ·å–è¯äh±‚çš„æ•°æ®ï¼Œ˜q™éœ€è¦ä¸‰‹Æ¡è¯·æ±‚æ‰èƒ½æ‰¾åˆ°ç”¨æˆ·Tableæ‰€åœ¨çš„ä½ç½®åQŒç„¶åŽç¬¬å››æ¬¡è¯äh±‚å¼€å§‹èŽ·å–çœŸæ£çš„æ•°æ®ã€‚å½“ç„¶äØ“äº†æå‡æ€§èƒ½åQŒå®¢æˆïL«¯ä¼šç¼“å?ROOT- Tableä½ç½®ä»¥åŠ-ROOT-/.META. Tableçš„å†…å®V€‚å¦‚ä¸‹å›¾æ‰€½Cºï¼š<br /> <img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/image0030.jpg" height="228" width="399" /><br /> å¯æ˜¯å³ä‹Éå®¢æˆ·ç«¯æœ‰¾~“å˜åQŒåœ¨åˆå§‹é˜¶æ®µéœ€è¦ä¸‰‹Æ¡è¯·æ±‚æ‰èƒ½ç›´åˆ°ç”¨æˆ·TableçœŸæ£æ‰€åœ¨çš„ä½ç½®ä¹Ÿæ˜¯æ€§èƒ½ä½Žä¸‹çš„ï¼Œè€Œä¸”çœŸçš„æœ‰å¿…è¦æ”¯æŒé‚£ä¹ˆå¤šçš„HRegionå—ï¼Ÿæˆ–è®¸å¯¹Google˜q™æ ·çš„å…¬å¸æ¥è¯´æ˜¯éœ€è¦çš„åQŒä½†æ˜¯å¯¹ä¸€èˆ¬çš„é›†ç¾¤æ¥è¯´å¥½åƒòq¶æ²¡æœ‰è¿™ä¸ªå¿…è¦ã€‚åœ¨BigTableçš„è®ºæ–‡ä¸è¯ß_¼Œæ¯è¡ŒMETADATAå˜å‚¨1KBå·¦å³æ•°æ®åQŒä¸½{‰å¤§ž®çš„Tablet(HRegion)åœ?28MBå·¦å³åQ?å±‚ä½¾|®çš„Schemaè®¾è®¡å¯ä»¥æ”¯æŒ2^34ä¸ªTablet(HRegion)ã€‚å³ä½¿åŽ»æŽ?ROOT- TableåQŒä¹Ÿ˜q˜å¯ä»¥æ”¯æŒ?^17(131072)ä¸ªHRegionåQ?å¦‚æžœæ¯ä¸ªHRegion˜q˜æ˜¯128MBåQŒé‚£ž®±æ˜¯16TBåQŒè¿™ä¸ªè²Œä¼ég¸å¤Ÿå¤§åQŒä½†æ˜¯çŽ°åœ¨çš„HRegionçš„æœ€å¤§å¤§ž®éƒ½ä¼šè®¾¾|®çš„æ¯”è¾ƒå¤§ï¼Œæ¯”å¦‚æˆ‘ä»¬è®„¡½®äº?GBåQŒæ¤æ—¶æ”¯æŒçš„å¤§å°åˆ™å˜æˆäº†4PBåQŒå¯¹ä¸€èˆ¬çš„é›†ç¾¤æ¥è¯´å·²ç»å¤Ÿäº†åQŒå› è€Œåœ¨HBase 0.96ä»¥åŽåŽÀLŽ‰äº?ROOT- TableåQŒåªå‰©ä¸‹˜q™ä¸ªç‰ÒŽ®Šçš„ç›®å½•è¡¨å«åšMeta Table(hbase:meta)åQŒå®ƒå˜å‚¨äº†é›†¾Ÿ¤ä¸æ‰€æœ‰ç”¨æˆ·HRegionçš„ä½¾|®ä¿¡æ¯ï¼Œè€ŒZooKeeperçš„èŠ‚ç‚¹ä¸(/hbase/meta-region-server)å˜å‚¨çš„åˆ™ç›´æŽ¥æ˜¯è¿™ä¸ªMeta Tableçš„ä½¾|®ï¼Œòq¶ä¸”˜q™ä¸ªMeta Tableå¦‚ä»¥å‰çš„-ROOT- Tableä¸€æ äh˜¯ä¸å¯splitçš„ã€‚è¿™æ øP¼Œå®¢æˆ·ç«¯åœ¨½W¬ä¸€‹Æ¡è®¿é—®ç”¨æˆ·Tableçš„æµ½E‹å°±å˜æˆäº†ï¼š<br /> <ol> <li>ä»ŽZooKeeper(/hbase/meta-region-server)ä¸èŽ·å–hbase:metaçš„ä½¾|®ï¼ˆHRegionServerçš„ä½¾|®ï¼‰åQŒç¼“å˜è¯¥ä½ç½®ä¿¡æ¯ã€?/li> <li>ä»ŽHRegionServerä¸æŸ¥è¯¢ç”¨æˆ·Tableå¯¹åº”è¯äh±‚çš„RowKeyæ‰€åœ¨çš„HRegionServeråQŒç¼“å˜è¯¥ä½ç½®ä¿¡æ¯ã€?/li> <li>ä»ŽæŸ¥è¯¢åˆ°HRegionServerä¸è¯»å–Rowã€?/li> </ol> ä»Žè¿™ä¸ªè¿‡½E‹ä¸åQŒæˆ‘ä»¬å‘çŽ°å®¢æˆ·ä¼š¾~“å˜˜q™äº›ä½ç½®ä¿¡æ¯åQŒç„¶è€Œç¬¬äºŒæ¥å®ƒåªæ˜¯ç¼“å˜å½“å‰RowKeyå¯¹åº”çš„HRegionçš„ä½¾|®ï¼Œå› è€Œå¦‚æžœä¸‹ä¸€ä¸ªè¦æŸ¥çš„RowKeyä¸åœ¨åŒä¸€ä¸ªHRegionä¸ï¼Œåˆ™éœ€è¦ç‘ô¾læŸ¥è¯¢hbase:metaæ‰€åœ¨çš„HRegionåQŒç„¶è€Œéšç€æ—‰™—´çš„æŽ¨¿U»ï¼Œå®¢æˆ·ç«¯ç¼“å˜çš„ä½ç½®ä¿¡æ¯‘Šæ¥‘Šå¤šåQŒä»¥è‡³äºŽä¸éœ€è¦å†‹Æ¡æŸ¥æ‰¾hbase:meta Tableçš„ä¿¡æ¯ï¼Œé™¤éžæŸä¸ªHRegionå› äØ“å®•æœºæˆ–Splitè¢«ç§»åŠ¨ï¼Œæ¤æ—¶éœ€è¦é‡æ–°æŸ¥è¯¢åÆˆä¸”æ›´æ–°ç¼“å˜ã€?br /> <img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig6.png" height="356" width="590" /><br /> <h3> hbase:metaè¡?/h3> hbase:metaè¡¨å˜å‚¨äº†æ‰€æœ‰ç”¨æˆ·HRegionçš„ä½¾|®ä¿¡æ¯ï¼Œå®ƒçš„RowKeyæ˜¯ï¼štableName,regionStartKey,regionId,replicaId½{‰ï¼Œå®ƒåªæœ‰infoåˆ—æ—åQŒè¿™ä¸ªåˆ—æ—åŒ…å«ä¸‰ä¸ªåˆ—åQŒä»–ä»¬åˆ†åˆ«æ˜¯åQšinfo:regioninfoåˆ—æ˜¯RegionInfoçš„protoæ ¼å¼åQšregionId,tableName,startKey,endKey,offline,split,replicaIdåQ›info:serveræ ¼å¼åQšHRegionServerå¯¹åº”çš„server:portåQ›info:serverstartcodeæ ¼å¼æ˜¯HRegionServerçš„å¯åŠ¨æ—¶é—´æˆ³ã€?br /> <img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig7.png" height="362" width="736" /><br /> <h2>HRegionServerè¯¦è§£</h2> HRegionServerä¸€èˆ¬å’ŒDataNodeåœ¨åŒä¸€å°æœºå™¨ä¸Š˜qè¡ŒåQŒå®žçŽ°æ•°æ®çš„æœ¬åœ°æ€§ã€‚HRegionServeråŒ…å«å¤šä¸ªHRegionåQŒç”±WAL(HLog)ã€BlockCacheã€MemStoreã€HFile¾l„æˆã€?br /> <ol> <li><strong>WALå³Write Ahead Log</strong>åQŒåœ¨æ—©æœŸç‰ˆæœ¬ä¸ç§°ä¸ºHLogåQŒå®ƒæ˜¯HDFSä¸Šçš„ä¸€ä¸ªæ–‡ä»Óž¼Œå¦‚å…¶åå—æ‰€è¡¨ç¤ºçš„ï¼Œæ‰€æœ‰å†™æ“ä½œéƒ½ä¼šå…ˆä¿è¯å°†æ•°æ®å†™å…¥˜q™ä¸ªLogæ–‡äšgåŽï¼Œæ‰ä¼šçœŸæ£æ›´æ–°MemStoreåQŒæœ€åŽå†™å…¥HFileä¸ã€‚é‡‡ç”¨è¿™¿Uæ¨¡å¼ï¼Œå¯ä»¥ä¿è¯HRegionServerå®•æœºåŽï¼Œæˆ‘ä»¬ä¾ç„¶å¯ä»¥ä»Žè¯¥Logæ–‡äšgä¸è¯»å–æ•°æ®ï¼ŒReplayæ‰€æœ‰çš„æ“ä½œåQŒè€Œä¸è‡³äºŽæ•°æ®ä¸¢å¤±ã€‚è¿™ä¸ªLogæ–‡äšgä¼šå®šæœŸRollå‡ºæ–°çš„æ–‡ä»¶è€Œåˆ é™¤æ—§çš„æ–‡ä»?é‚£äº›å·²æŒä¹…åŒ–åˆ°HFileä¸çš„Logå¯ä»¥åˆ é™¤)ã€‚WALæ–‡äšgå˜å‚¨åœ?hbase/WALs/${HRegionServer_Name}çš„ç›®å½•ä¸(åœ?.94ä¹‹å‰åQŒå˜å‚¨åœ¨/hbase/.logs/ç›®å½•ä¸?åQŒä¸€èˆ¬ä¸€ä¸ªHRegionServeråªæœ‰ä¸€ä¸ªWALå®žä¾‹åQŒä¹Ÿž®±æ˜¯è¯´ä¸€ä¸ªHRegionServerçš„æ‰€æœ‰WALå†™éƒ½æ˜¯ä¸²è¡Œçš„(ž®±åƒlog4jçš„æ—¥å¿—å†™ä¹Ÿæ˜¯ä¸²è¡Œçš?åQŒè¿™å½“ç„¶ä¼šå¼•èµäh€§èƒ½é—®é¢˜åQŒå› è€Œåœ¨HBase 1.0ä¹‹åŽåQŒé€šè¿‡<a >HBASE-5699</a>å®žçŽ°äº†å¤šä¸ªWALòq¶è¡Œå†?MultiWAL)åQŒè¯¥å®žçŽ°é‡‡ç”¨HDFSçš„å¤šä¸ªç®¡é“å†™åQŒä»¥å•ä¸ªHRegionä¸ºå•ä½ã€‚å…³äºŽWALå¯ä»¥å‚è€ƒWikipediaçš?a >Write-Ahead Logging</a>ã€‚é¡ºä¾¿åæ§½ä¸€å¥ï¼Œè‹±æ–‡ç‰ˆçš„¾l´åŸºç™„¡§‘ç«Ÿç„¶èƒ½æ¯«æ— åŽ‹åŠ›çš„æ£å¸¸è®‰K—®äº†ï¼Œ˜q™æ˜¯æŸä¸ªGFWçš„ç–å¿½è¿˜æ˜¯ä»¥åŽçš„å¸¸æ€ï¼Ÿ</li> <li><strong>BlockCacheæ˜¯ä¸€ä¸ªè¯»¾~“å˜</strong>åQŒå³“å¼•ç”¨å±€éƒ¨æ€?#8221;åŽŸç†åQˆä¹Ÿåº”ç”¨äºŽCPUåQ?a >åˆ†ç©ºé—´å±€éƒ¨æ€§å’Œæ—‰™—´å±€éƒ¨æ€?/a>åQŒç©ºé—´å±€éƒ¨æ€§æ˜¯æŒ‡CPUåœ¨æŸä¸€æ—¶åˆ»éœ€è¦æŸä¸ªæ•°æ®ï¼Œé‚£ä¹ˆæœ‰å¾ˆå¤§çš„æ¦‚çŽ‡åœ¨ä¸€ä¸‹æ—¶åˆÕd®ƒéœ€è¦çš„æ•°æ®åœ¨å…¶é™„è¿‘åQ›æ—¶é—´å±€éƒ¨æ€§æ˜¯æŒ‡æŸä¸ªæ•°æ®åœ¨è¢«è®¿é—®è¿‡ä¸€‹Æ¡åŽåQŒå®ƒæœ‰å¾ˆå¤§çš„æ¦‚çŽ‡åœ¨ä¸ä¹…çš„ž®†æ¥ä¼šè¢«å†æ¬¡çš„è®¿é—®ï¼‰åQŒå°†æ•°æ®é¢„è¯»å–åˆ°å†…å˜ä¸ï¼Œä»¥æå‡è¯»çš„æ€§èƒ½ã€‚HBaseä¸æä¾›ä¸¤¿UBlockCacheçš„å®žçŽŽÍ¼šé»˜è®¤on-heap LruBlockCacheå’ŒBucketCache(é€šå¸¸æ˜¯off-heap)ã€‚é€šå¸¸BucketCacheçš„æ€§èƒ½è¦å·®äºŽLruBlockCacheåQŒç„¶è€Œç”±äºŽGCçš„åª„å“ï¼ŒLruBlockCacheçš„åšg˜qŸä¼šå˜çš„ä¸ç¨³å®šï¼Œè€ŒBucketCacheç”×ƒºŽæ˜¯è‡ªå·Þq®¡ç†BlockCacheåQŒè€Œä¸éœ€è¦GCåQŒå› è€Œå®ƒçš„åšg˜qŸé€šå¸¸æ¯”è¾ƒ½E›_®šåQŒè¿™ä¹Ÿæ˜¯æœ‰äº›æ—¶å€™éœ€è¦é€‰ç”¨BucketCacheçš„åŽŸå› ã€‚è¿™½‹‡æ–‡ç«?a >BlockCache101</a>å¯¹on-heapå’Œoff-heapçš„BlockCacheåšäº†è¯¦ç»†çš„æ¯”è¾ƒã€?/li><strong> </strong><li><strong>HRegionæ˜¯ä¸€ä¸ªTableä¸çš„ä¸€ä¸ªRegionåœ¨ä¸€ä¸ªHRegionServerä¸çš„è¡¨è¾¾</strong>ã€‚ä¸€ä¸ªTableå¯ä»¥æœ‰ä¸€ä¸ªæˆ–å¤šä¸ªRegionåQŒä»–ä»¬å¯ä»¥åœ¨ä¸€ä¸ªç›¸åŒçš„HRegionServerä¸Šï¼Œä¹Ÿå¯ä»¥åˆ†å¸ƒåœ¨ä¸åŒçš„HRegionServerä¸Šï¼Œä¸€ä¸ªHRegionServerå¯ä»¥æœ‰å¤šä¸ªHRegionåQŒä»–ä»¬åˆ†åˆ«å±žäºŽä¸åŒçš„Tableã€‚HRegionç”±å¤šä¸ªStore(HStore)æž„æˆåQŒæ¯ä¸ªHStoreå¯¹åº”äº†ä¸€ä¸ªTableåœ¨è¿™ä¸ªHRegionä¸çš„ä¸€ä¸ªColumn FamilyåQŒå³æ¯ä¸ªColumn Familyž®±æ˜¯ä¸€ä¸ªé›†ä¸çš„å˜å‚¨å•å…ƒåQŒå› è€Œæœ€å¥½å°†å…ähœ‰ç›¸è¿‘IOç‰ÒŽ€§çš„Columnå˜å‚¨åœ¨ä¸€ä¸ªColumn FamilyåQŒä»¥å®žçŽ°é«˜æ•ˆè¯Õd–(æ•°æ®å±€éƒ¨æ€§åŽŸç†ï¼Œå¯ä»¥æé«˜¾~“å˜çš„å‘½ä¸çŽ‡)ã€‚HStoreæ˜¯HBaseä¸å˜å‚¨çš„æ ¸å¿ƒåQŒå®ƒå®žçŽ°äº†è¯»å†™HDFSåŠŸèƒ½åQŒä¸€ä¸ªHStoreç”×ƒ¸€ä¸ªMemStore å’?ä¸ªæˆ–å¤šä¸ªStoreFile¾l„æˆã€?br /> <ol> <li><strong>MemStoreæ˜¯ä¸€ä¸ªå†™¾~“å˜</strong>(In Memory Sorted Buffer)åQŒæ‰€æœ‰æ•°æ®çš„å†™åœ¨å®ŒæˆWALæ—¥å¿—å†™åŽåQŒä¼š å†™å…¥MemStoreä¸ï¼Œç”±MemStoreæ ÒŽ®ä¸€å®šçš„½Ž—æ³•ž®†æ•°æ®Flushåˆ°åœ°å±‚HDFSæ–‡äšgä¸?HFile)åQŒé€šå¸¸æ¯ä¸ªHRegionä¸çš„æ¯ä¸ª Column Familyæœ‰ä¸€ä¸ªè‡ªå·Þqš„MemStoreã€?/li> <li><strong>HFile(StoreFile) ç”¨äºŽå˜å‚¨HBaseçš„æ•°æ?Cell/KeyValue)</strong>ã€‚åœ¨HFileä¸çš„æ•°æ®æ˜¯æŒ‰RowKeyã€Column Familyã€ColumnæŽ’åºåQŒå¯¹ç›¸åŒçš„Cell(åŒ™¿™ä¸‰ä¸ªå€¼éƒ½ä¸€æ ?åQŒåˆ™æŒ‰timestampå€’åºæŽ’åˆ—ã€?/li> </ol> </li> </ol> <img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig8.png" /><br /> è™½ç„¶ä¸Šé¢˜q™å¼ å›‘Ö±•çŽ°çš„æ˜¯æœ€æ–°çš„HRegionServerçš„æž¶æž?ä½†æ˜¯òq¶ä¸æ˜¯é‚£ä¹ˆçš„¾_„¡¡®)åQŒä½†æ˜¯æˆ‘ä¸€ç›´æ¯”è¾ƒå–œ‹Æ¢çœ‹ä»¥ä¸‹˜q™å¼ å›¾ï¼Œå³ä‹Éå®ƒå±•çŽ°çš„åº”è¯¥æ˜?.94ä»¥å‰çš„æž¶æž„ã€?br /> <img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/image0060.jpg" height="347" width="553" /><br /> <h3> HRegionServerä¸æ•°æ®å†™‹¹ç¨‹å›¾è§£</h3> å½“å®¢æˆïL«¯å‘è“vä¸€ä¸ªPutè¯äh±‚æ—Óž¼Œé¦–å…ˆå®ƒä»Žhbase:metaè¡¨ä¸æŸ¥å‡ºè¯¥Putæ•°æ®æœ€¾lˆéœ€è¦åŽ»çš„HRegionServerã€‚ç„¶åŽå®¢æˆïL«¯ž®†Putè¯äh±‚å‘é€ç»™ç›¸åº”çš„HRegionServeråQŒåœ¨HRegionServerä¸å®ƒé¦–å…ˆä¼šå°†è¯¥Putæ“ä½œå†™å…¥WALæ—¥å¿—æ–‡äšgä¸?Flushåˆ°ç£ç›˜ä¸)ã€?br /><img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig9.png" height="363" width="716" /><br /> å†™å®ŒWALæ—¥å¿—æ–‡äšgåŽï¼ŒHRegionServeræ ÒŽ®Putä¸çš„TableNameå’ŒRowKeyæ‰‘Öˆ°å¯¹åº”çš„HRegionåQŒåÆˆæ ÒŽ®Column Familyæ‰‘Öˆ°å¯¹åº”çš„HStoreåQŒåÆˆž®†Putå†™å…¥åˆ°è¯¥HStoreçš„MemStoreä¸ã€‚æ¤æ—¶å†™æˆåŠŸåQŒåÆˆ˜q”å›žé€šçŸ¥å®¢æˆ·ç«¯ã€?br /><img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig10.png" height="298" width="664" /><br /><h3>MemStore Flush<br /></h3>MemStoreæ˜¯ä¸€ä¸ªIn Memory Sorted BufferåQŒåœ¨æ¯ä¸ªHStoreä¸éƒ½æœ‰ä¸€ä¸ªMemStoreåQŒå³å®ƒæ˜¯ä¸€ä¸ªHRegionçš„ä¸€ä¸ªColumn Familyå¯¹åº”ä¸€ä¸ªå®žä¾‹ã€‚å®ƒçš„æŽ’åˆ—é¡ºåºä»¥RowKeyã€Column Familyã€Columnçš„é¡ºåºä»¥åŠTimestampçš„å€’åºåQŒå¦‚ä¸‹æ‰€½Cºï¼š<br /><img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig11.png" height="351" width="719" /><br />æ¯ä¸€‹Æ¡Put/Deleteè¯äh±‚éƒ½æ˜¯å…ˆå†™å…¥åˆ°MemStoreä¸ï¼Œå½“MemStoreæ»¡åŽä¼šFlushæˆä¸€ä¸ªæ–°çš„StoreFile(åº•å±‚å®žçŽ°æ˜¯HFile)åQŒå³ä¸€ä¸ªHStore(Column Family)å¯ä»¥æœ?ä¸ªæˆ–å¤šä¸ªStoreFile(HFile)ã€‚æœ‰ä»¥ä¸‹ä¸‰ç§æƒ…å†µå¯ä»¥è§¦å‘MemStoreçš„FlushåŠ¨ä½œåQ?strong>éœ€è¦æ³¨æ„çš„æ˜¯MemStoreçš„æœ€ž®Flushå•å…ƒæ˜¯HRegionè€Œä¸æ˜¯å•ä¸ªMemStore</strong>ã€‚æ®è¯´è¿™æ˜¯Column Familyæœ‰ä¸ªæ•°é™åˆ¶çš„å…¶ä¸ä¸€ä¸ªåŽŸå› ï¼Œä¼°è®¡æ˜¯å› ä¸ºå¤ªå¤šçš„Column Familyä¸€èµ·Flushä¼šå¼•èµäh€§èƒ½é—®é¢˜åQŸå…·ä½“åŽŸå› æœ‰å¾…è€ƒè¯ã€?br /><ol><li>å½“ä¸€ä¸ªHRegionä¸çš„æ‰€æœ‰MemStoreçš„å¤§ž®æ€Õd’Œ‘…è¿‡äº†hbase.hregion.memstore.flush.sizeçš„å¤§ž®ï¼Œé»˜è®¤128MBã€‚æ¤æ—¶å½“å‰çš„HRegionä¸æ‰€æœ‰çš„MemStoreä¼šFlushåˆ°HDFSä¸ã€?/li><li>å½“å…¨å±€MemStoreçš„å¤§ž®è¶…˜q‡äº†hbase.regionserver.global.memstore.upperLimitçš„å¤§ž®ï¼Œé»˜è®¤40åQ…çš„å†…å˜ä½¿ç”¨é‡ã€‚æ¤æ—¶å½“å‰HRegionServerä¸æ‰€æœ‰HRegionä¸çš„MemStoreéƒ½ä¼šFlushåˆ°HDFSä¸ï¼ŒFlush™åºåºæ˜¯MemStoreå¤§å°çš„å€’åºåQˆä¸€ä¸ªHRegionä¸æ‰€æœ‰MemStoreæ€Õd’Œä½œäØ“è¯¥HRegionçš„MemStoreçš„å¤§ž®è¿˜æ˜¯é€‰å–æœ€å¤§çš„MemStoreä½œäØ“å‚è€ƒï¼Ÿæœ‰å¾…è€ƒè¯åQ‰ï¼Œç›´åˆ°æ€ÖM½“çš„MemStoreä½¿ç”¨é‡ä½ŽäºŽhbase.regionserver.global.memstore.lowerLimitåQŒé»˜è®?8%çš„å†…å˜ä‹Éç”¨é‡ã€?/li><li>å½“å‰HRegionServerä¸WALçš„å¤§ž®è¶…˜q‡äº†hbase.regionserver.hlog.blocksize hbase.regionserver.max.logsçš„æ•°é‡ï¼Œå½“å‰HRegionServerä¸æ‰€æœ‰HRegionä¸çš„MemStoreéƒ½ä¼šFlushåˆ°HDFSä¸ï¼ŒFlushä½¿ç”¨æ—‰™—´™åºåºåQŒæœ€æ—©çš„MemStoreå…ˆFlushç›´åˆ°WALçš„æ•°é‡å°‘äºŽhbase.regionserver.hlog.blocksize * hbase.regionserver.max.logsã€?a >˜q™é‡Œ</a>è¯´è¿™ä¸¤ä¸ªç›æ€¹˜çš„é»˜è®¤å¤§ž®æ˜¯2GBåQŒæŸ¥ä»£ç åQŒhbase.regionserver.max.logsé»˜è®¤å€¼æ˜¯32åQŒè€Œhbase.regionserver.hlog.blocksizeæ˜¯HDFSçš„é»˜è®¤blocksizeåQ?2MBã€‚ä½†ä¸ç®¡æ€Žä¹ˆæ øP¼Œå› äØ“˜q™ä¸ªå¤§å°‘…è¿‡é™åˆ¶å¼•è“vçš„Flushä¸æ˜¯ä¸€ä»¶å¥½äº‹ï¼Œå¯èƒ½å¼•è“vé•¿æ—¶é—´çš„å»¶è¿ŸåQŒå› è€Œè¿™½‹‡æ–‡ç« ç»™çš„å¾è®®ï¼š“<strong style="color: #339966; font-family: STHeiti; font-size: medium; font-style: normal; font-variant: normal; letter-spacing: normal; line-height: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: 1; word-spacing: 0px; -webkit-text-stroke-width: 0px;">Hint</strong><span style="color: #339966; font-family: STHeiti; font-size: medium; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: 1; word-spacing: 0px; -webkit-text-stroke-width: 0px; display: inline !important; float: none;">: keep hbase.regionserver.hlog.blocksize * hbase.regionserver.maxlogs just a bit above hbase.regionserver.global.memstore.lowerLimit * HBASE_HEAPSIZE.</span>”ã€‚åÆˆä¸”éœ€è¦æ³¨æ„ï¼Œ<a >˜q™é‡Œ</a>¾l™çš„æè¿°æ˜¯æœ‰é”™çš„(è™½ç„¶å®ƒæ˜¯å®˜æ–¹çš„æ–‡æ¡?ã€?br /></li></ol>åœ¨MemStore Flush˜q‡ç¨‹ä¸ï¼Œ˜q˜ä¼šåœ¨å°¾éƒ¨è¿½åŠ ä¸€äº›metaæ•°æ®åQŒå…¶ä¸å°±åŒ…æ‹¬Flushæ—¶æœ€å¤§çš„WAL sequenceå€û|¼Œä»¥å‘Šè¯‰HBase˜q™ä¸ªStoreFileå†™å…¥çš„æœ€æ–°æ•°æ®çš„åºåˆ—åQŒé‚£ä¹ˆåœ¨Recoveræ—¶å°±ç›´åˆ°ä»Žå“ªé‡Œå¼€å§‹ã€‚åœ¨HRegionå¯åŠ¨æ—Óž¼Œ˜q™ä¸ªsequenceä¼šè¢«è¯Õd–åQŒåÆˆå–æœ€å¤§çš„ä½œäØ“ä¸‹ä¸€‹Æ¡æ›´æ–°æ—¶çš„è“vå§‹sequenceã€?br /><img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig12.png" height="248" width="622" /><br /><h2> HFileæ ¼å¼</h2>HBaseçš„æ•°æ®ä»¥KeyValue(Cell)çš„åÅžå¼é¡ºåºçš„å˜å‚¨åœ¨HFileä¸ï¼Œåœ¨MemStoreçš„Flush˜q‡ç¨‹ä¸ç”ŸæˆHFileåQŒç”±äºŽMemStoreä¸å˜å‚¨çš„Celléµåó@ç›¸åŒçš„æŽ’åˆ—é¡ºåºï¼Œå› è€ŒFlush˜q‡ç¨‹æ˜¯é¡ºåºå†™åQŒæˆ‘ä»¬ç›´åˆ°ç£ç›˜çš„™åºåºå†™æ€§èƒ½å¾ˆé«˜åQŒå› ä¸ÞZ¸éœ€è¦ä¸åœçš„¿UÕdŠ¨¼‚ç›˜æŒ‡é’ˆã€?br /><img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig13.png" height="351" width="698" /><br />HFileå‚è€ƒBigTableçš„SSTableå’ŒHadoopçš?a >TFile</a>å®žçŽ°åQŒä»ŽHBaseå¼€å§‹åˆ°çŽ°åœ¨åQŒHFile¾låŽ†äº†ä¸‰ä¸ªç‰ˆæœ¬ï¼Œå…¶ä¸V2åœ?.92å¼•å…¥åQŒV3åœ?.98å¼•å…¥ã€‚é¦–å…ˆæˆ‘ä»¬æ¥çœ‹ä¸€ä¸‹V1çš„æ ¼å¼ï¼š<br /><img src="http://www.aygfsteel.com/images/blogjava_net/dlevin/image0080.jpg" alt="" height="160" border="0" width="554" /><br />V1çš„HFileç”±å¤šä¸ªData Blockã€Meta Blockã€FileInfoã€Data Indexã€Meta Indexã€Trailer¾l„æˆåQŒå…¶ä¸Data Blockæ˜¯HBaseçš„æœ€ž®å˜å‚¨å•å…ƒï¼Œåœ¨å‰æ–‡ä¸æåˆ°çš„BlockCachež®±æ˜¯åŸÞZºŽData Blockçš„ç¼“å˜çš„ã€‚ä¸€ä¸ªData Blockç”×ƒ¸€ä¸ªé”æ•°å’Œä¸€¾pÕdˆ—çš„KeyValue(Cell)¾l„æˆåQŒé”æ•°æ˜¯ä¸€ä¸ªéšæœºçš„æ•°å—åQŒç”¨äºŽè¡¨½Cø™¿™æ˜¯ä¸€ä¸ªData Block¾cÕdž‹åQŒä»¥å¿«é€Ÿç›‘‹¹‹è¿™ä¸ªData Blockçš„æ ¼å¼ï¼Œé˜²æ¢æ•°æ®çš„ç ´åã€‚Data Blockçš„å¤§ž®å¯ä»¥åœ¨åˆ›å¾Column Familyæ—¶è®¾¾|?HColumnDescriptor.setBlockSize())åQŒé»˜è®¤å€¼æ˜¯64KBåQŒå¤§åïLš„Blockæœ‰åˆ©äºŽé¡ºåºScanåQŒå°å·Blockåˆ©äºŽéšæœºæŸ¥è¯¢åQŒå› è€Œéœ€è¦æƒè¡¡ã€‚Metaå—æ˜¯å¯é€‰çš„åQŒFileInfoæ˜¯å›ºå®šé•¿åº¦çš„å—ï¼Œå®ƒçºªå½•äº†æ–‡äšgçš„ä¸€äº›Metaä¿¡æ¯åQŒä¾‹å¦‚ï¼šAVG_KEY_LEN, AVG_VALUE_LEN, LAST_KEY, COMPARATOR, MAX_SEQ_ID_KEY½{‰ã€‚Data Indexå’ŒMeta Index¾Uªå½•äº†æ¯ä¸ªDataå—å’ŒMetaå—çš„å…¶å®žç‚V€æœªåŽ‹ç¾ƒæ—¶å¤§ž®ã€Key(èµ·å§‹RowKeyåQ?½{‰ã€‚Trailer¾Uªå½•äº†FileInfoã€Data Indexã€Meta Indexå—çš„èµ·å§‹ä½ç½®åQŒData Indexå’ŒMeta Indexç´¢å¼•çš„æ•°é‡ç‰ã€‚å…¶ä¸FileInfoå’ŒTraileræ˜¯å›ºå®šé•¿åº¦çš„ã€?br /><br />HFileé‡Œé¢çš„æ¯ä¸ªKeyValueå¯¹å°±æ˜¯ä¸€ä¸ªç®€å•çš„byteæ•°ç»„ã€‚ä½†æ˜¯è¿™ä¸ªbyteæ•°ç»„é‡Œé¢åŒ…å«äº†å¾ˆå¤šé¡¹åQŒåÆˆä¸”æœ‰å›ºå®šçš„ç»“æž„ã€‚æˆ‘ä»¬æ¥çœ‹çœ‹é‡Œé¢çš„å…·ä½“ç»“æž„ï¼š<br /><img src="http://www.aygfsteel.com/images/blogjava_net/dlevin/image0090.jpg" alt="" height="93" border="0" width="553" /><br />å¼€å§‹æ˜¯ä¸¤ä¸ªå›ºå®šé•¿åº¦çš„æ•°å€û|¼Œåˆ†åˆ«è¡¨ç¤ºKeyçš„é•¿åº¦å’ŒValueçš„é•¿åº¦ã€‚ç´§æŽ¥ç€æ˜¯KeyåQŒå¼€å§‹æ˜¯å›ºå®šé•¿åº¦çš„æ•°å€û|¼Œè¡¨ç¤ºRowKeyçš„é•¿åº¦ï¼Œç´§æŽ¥ç€æ˜? RowKeyåQŒç„¶åŽæ˜¯å›ºå®šé•¿åº¦çš„æ•°å€û|¼Œè¡¨ç¤ºFamilyçš„é•¿åº¦ï¼Œç„¶åŽæ˜¯FamilyåQŒæŽ¥ç€æ˜¯QualifieråQŒç„¶åŽæ˜¯ä¸¤ä¸ªå›ºå®šé•¿åº¦çš„æ•°å€û|¼Œè¡¨ç¤ºTime Stampå’ŒKey TypeåQˆPut/DeleteåQ‰ã€‚Valueéƒ¨åˆ†æ²¡æœ‰˜q™ä¹ˆå¤æ‚çš„ç»“æž„ï¼Œž®±æ˜¯¾U¯çÑaçš„äºŒ˜q›åˆ¶æ•°æ®äº†ã€?strong>éšç€HFileç‰ˆæœ¬˜qç§»åQŒKeyValue(Cell)çš„æ ¼å¼åÆˆæœªå‘ç”Ÿå¤ªå¤šå˜åŒ–ï¼Œåªæ˜¯åœ¨V3ç‰ˆæœ¬åQŒå°¾éƒ¨æ·»åŠ äº†ä¸€ä¸ªå¯é€‰çš„Tagæ•°ç»„</strong>ã€?br /> <br />HFileV1ç‰ˆæœ¬çš„åœ¨å®žé™…ä½¿ç”¨˜q‡ç¨‹ä¸å‘çŽ°å®ƒå ç”¨å†…å˜å¤šï¼Œòq¶ä¸”Bloom Fileå’ŒBlock Indexä¼šå˜çš„å¾ˆå¤§ï¼Œè€Œå¼•èµ·å¯åŠ¨æ—¶é—´å˜é•Ñ€‚å…¶ä¸æ¯ä¸ªHFileçš„Bloom Filterå¯ä»¥å¢žé•¿åˆ?00MBåQŒè¿™åœ¨æŸ¥è¯¢æ—¶ä¼šå¼•èµäh€§èƒ½é—®é¢˜åQŒå› ä¸ºæ¯‹Æ¡æŸ¥è¯¢æ—¶éœ€è¦åŠ è½½åÆˆæŸ¥è¯¢Bloom FilteråQ?00MBçš„Bloom Filerä¼šå¼•èµ·å¾ˆå¤§çš„å»¶è¿ŸåQ›å¦ä¸€ä¸ªï¼ŒBlock Indexåœ¨ä¸€ä¸ªHRegionServerå¯èƒ½ä¼šå¢žé•¿åˆ°æ€Õd…±6GBåQŒHRegionServeråœ¨å¯åŠ¨æ—¶éœ€è¦å…ˆåŠ è²æ‰€æœ‰è¿™äº›Block IndexåQŒå› è€Œå¢žåŠ äº†å¯åŠ¨æ—‰™—´ã€‚äØ“äº†è§£å†Œ™¿™äº›é—®é¢˜ï¼Œåœ?.92ç‰ˆæœ¬ä¸å¼•å…¥HFileV2ç‰ˆæœ¬åQ?br /><img src="http://www.aygfsteel.com/images/blogjava_net/dlevin/hfilev2.png" alt="" height="418" border="0" width="566" /><br />åœ¨è¿™ä¸ªç‰ˆæœ¬ä¸åQŒBlock Indexå’ŒBloom Filteræ·ÕdŠ åˆîCº†Data Blockä¸é—´åQŒè€Œè¿™¿Uè®¾è®¡åŒæ—¶ä¹Ÿå‡å°‘äº†å†™çš„å†…å˜ä‹Éç”¨é‡åQ›å¦å¤–ï¼Œä¸ÞZº†æå‡å¯åŠ¨é€Ÿåº¦åQŒåœ¨˜q™ä¸ªç‰ˆæœ¬ä¸è¿˜å¼•å…¥äº†åšg˜qŸè¯»çš„åŠŸèƒ½ï¼Œå›_œ¨HFileçœŸæ£è¢«ä‹Éç”¨æ—¶æ‰å¯¹å…¶è¿›è¡Œè§£æžã€?br /><br />FileV3ç‰ˆæœ¬åŸºæœ¬å’ŒV2ç‰ˆæœ¬ç›¸æ¯”åQŒåÆˆæ²¡æœ‰å¤ªå¤§çš„æ”¹å˜ï¼Œå®ƒåœ¨KeyValue(Cell)å±‚é¢ä¸Šæ·»åŠ äº†Tagæ•°ç»„çš„æ”¯æŒï¼›òq¶åœ¨FileInfo¾l“æž„ä¸æ·»åŠ äº†å’ŒTagç›¸å…³çš„ä¸¤ä¸ªå—ŒDüc€‚å…³äºŽå…·ä½“HFileæ ¼å¼æ¼”åŒ–ä»‹ç»åQŒå¯ä»¥å‚è€?a >˜q™é‡Œ</a>ã€?br /><br />å¯¹HFileV2æ ¼å¼å…·ä½“åˆ†æžåQŒå®ƒæ˜¯ä¸€ä¸ªå¤šå±‚çš„¾c»B+æ ‘çƒ¦å¼•ï¼Œé‡‡ç”¨˜q™ç§è®¾è®¡åQŒå¯ä»¥å®žçŽ°æŸ¥æ‰¾ä¸éœ€è¦è¯»å–æ•´ä¸ªæ–‡ä»Óž¼š<br /><img alt="" src="http://www.aygfsteel.com/images/blogjava_net/dlevin/HBaseArchitecture-Blog-Fig14.png" height="349" width="688" /><br />Data Blockä¸çš„Celléƒ½æ˜¯å‡åºæŽ’åˆ—åQŒæ¯ä¸ªblockéƒ½æœ‰å®ƒè‡ªå·Þqš„Leaf-IndexåQŒæ¯ä¸ªBlockçš„æœ€åŽä¸€ä¸ªKeyè¢«æ”¾å…¥Intermediate-Indexä¸ï¼ŒRoot-IndexæŒ‡å‘Intermediate-Indexã€‚åœ¨HFileçš„æœ«ž®¾è¿˜æœ‰Bloom Filterç”¨äºŽå¿«é€Ÿå®šä½é‚£ä¹ˆæ²¡æœ‰åœ¨æŸä¸ªData Blockä¸çš„RowåQ›TimeRangeä¿¡æ¯ç”¨äºŽ¾l™é‚£äº›ä‹Éç”¨æ—¶é—´æŸ¥è¯¢çš„å‚è€ƒã€‚åœ¨HFileæ‰“å¼€æ—Óž¼Œ˜q™äº›ç´¢å¼•ä¿¡æ¯éƒ½è¢«åŠ è²òq¶ä¿å˜åœ¨å†…å˜ä¸ï¼Œä»¥å¢žåŠ ä»¥åŽçš„è¯Õd–æ€§èƒ½ã€?br /><br />˜q™ç¯‡ž®±å…ˆå†™åˆ°˜q™é‡ŒåQŒæœªå®Œå¾…¾lã€‚ã€‚ã€‚ã€?br /><br /> <h2>å‚è€ƒï¼š</h2> https://www.mapr.com/blog/in-depth-look-hbase-architecture#.VdNSN6Yp3qx<br /> http://jimbojw.com/wiki/index.php?title=Understanding_Hbase_and_BigTable<br /> http://hbase.apache.org/book.html <br /> http://www.searchtb.com/2011/01/understanding-hbase.html <br /> http://research.google.com/archive/bigtable-osdi06.pdf<img src ="http://www.aygfsteel.com/DLevin/aggbug/426877.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.aygfsteel.com/DLevin/" target="_blank">DLevin</a> 2015-08-22 17:44 <a href="http://www.aygfsteel.com/DLevin/archive/2015/08/22/426877.html#Feedback" target="_blank" style="text-decoration:none;">å‘è¡¨è¯„è®º</a></div>]]></description></item></channel></rss> <footer> <div class="friendship-link"> <a href="http://www.aygfsteel.com/" title="狠狠久久亚洲欧美专区_中文字幕亚洲综合久久202_国产精品亚洲第五区在线_日本免费网站视频">狠狠久久亚洲欧美专区_中文字幕亚洲综合久久202_国产精品亚洲第五区在线_日本免费网站视频</a> </div> </footer> Ö÷Õ¾Ö©Öë³ØÄ£°å£º <a href="http://" target="_blank">ÎâÇÅÏØ</a>| <a href="http://" target="_blank">Ê¯¾°É½Çø</a>| <a href="http://" target="_blank">ºØÀ¼ÏØ</a>| <a href="http://" target="_blank">°ÍÖÐÊÐ</a>| <a href="http://" target="_blank">´óÓ¢ÏØ</a>| <a href="http://" target="_blank">ÄÉÓºÏØ</a>| <a href="http://" target="_blank">Óí³ÇÊÐ</a>| <a href="http://" target="_blank">·ðÆºÏØ</a>| <a href="http://" target="_blank">ÄêÏ½£ºÊÐÏ½Çø</a>| <a href="http://" target="_blank">ÏåÔ«ÏØ</a>| <a href="http://" target="_blank">ÛÂº£ÏØ</a>| <a href="http://" target="_blank">×¼¸ñ¶ûÆì</a>| <a href="http://" target="_blank">Ê¼ÐËÏØ</a>| <a href="http://" target="_blank">»³À´ÏØ</a>| <a href="http://" target="_blank">°¢³ÇÊÐ</a>| <a href="http://" target="_blank">¸ßÑôÏØ</a>| <a href="http://" target="_blank">³çÈÊÏØ</a>| <a href="http://" target="_blank">ÈðÀöÊÐ</a>| <a href="http://" target="_blank">ÆÁÉ½ÏØ</a>| <a href="http://" target="_blank">´óÒ¦ÏØ</a>| <a href="http://" target="_blank">ÄôÀÄ¾ÏØ</a>| <a href="http://" target="_blank">ÐÏÌ¨ÏØ</a>| <a href="http://" target="_blank">´óÌïÏØ</a>| <a href="http://" target="_blank">ò£ÉÏÏØ</a>| <a href="http://" target="_blank">Í¨»¯ÊÐ</a>| <a href="http://" target="_blank">ÑÓÇìÏØ</a>| <a href="http://" target="_blank">Í©è÷ÏØ</a>| <a href="http://" target="_blank">ÒËÐËÊÐ</a>| <a href="http://" target="_blank">ËÕÄáÌØÓÒÆì</a>| <a href="http://" target="_blank">·¿É½Çø</a>| <a href="http://" target="_blank">ÃñºÍ</a>| <a href="http://" target="_blank">Â¡Ò¢ÏØ</a>| <a href="http://" target="_blank">À¶ÌïÏØ</a>| <a href="http://" target="_blank">¿¦À®ÇßÆì</a>| <a href="http://" target="_blank">¸ßÇå</a>| <a href="http://" target="_blank">³¤ÐËÏØ</a>| <a href="http://" target="_blank">Ñ®ÒØÏØ</a>| <a href="http://" target="_blank">²ªÀûÏØ</a>| <a href="http://" target="_blank">¾Å½ÊÐ</a>| <a href="http://" target="_blank">ÌÒÔ´ÏØ</a>| <a href="http://" target="_blank">¼Ó²éÏØ</a>| <script> (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })(); </script> </body>

SSTableä½œäØ“å­˜å‚¨ä½¿ç”¨

SSTableåœ¨Compaction˜q‡ç¨‹ä¸­çš„ä½¿ç”¨

SSTableçš„localityå’ŒIn Memory

SSTableåŽ‹ç¾ƒ

SSTableçš„è¯»¾~“å­˜

Bloom Filter

SSTableä½œäØ“å˜å‚¨ä½¿ç”¨

SSTableåœ¨Compaction˜q‡ç¨‹ä¸çš„ä½¿ç”¨

SSTableçš„è¯»¾~“å˜