我的Java路上那些事兒

快樂成長

posts - 110, comments - 101, trackbacks - 0, articles - 7

BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合

:: 管理

日歷

2012年8月

日

一

二

三

四

五

六

常用鏈接

留言簿(9)

隨筆檔案

搜索

閱讀排行榜

評論排行榜

htable coprocessor使用

Posted on 2012-08-16 17:30 云云閱讀(1177) 評論(1) 編輯收藏

在網瀏覽的時候發現了這篇文章很有用就保留了下來

hbase不是數據庫,一些數據庫中基本的功能hbase并不具備.
二級索引就是其中很重要的一點,在數據庫中索引是在平常不過的功能了.
而在hbase中,value上的索引只能靠自己來實現.

hbase中最簡單的二級索引的實現方式是通過另外一個hbase表來實現.
下面通過postput方法,實現對表sunwg01的二級索引.

舉例說下二級索引實現:
表sunwg01的f1:k1有如下記錄
100 tom
101 mary

對于表sunwg01來說，可以通過100，101直接訪問記錄，但是如果想要訪問mary這條記錄，則只能全表遍歷
為了解決這個問題，創建了表sunwg02
表sunwg02中的f1:k1有如下記錄
tom 100
mary 101

現在如果要查找mary這條記錄，可以先查表sunwg02中，找到mary的value的為101

下面通過postput方式實現，在put源表的同時更新索引表的功能。
詳細代碼如下：

import java.io.IOException; import java.util.Iterator; import java.util.List; import org.apache.hadoop.hbase.KeyValue; import org.apache.hadoop.hbase.client.HTable; import org.apache.hadoop.hbase.client.Put; import org.apache.hadoop.hbase.coprocessor.BaseRegionObserver; import org.apache.hadoop.hbase.coprocessor.ObserverContext; import org.apache.hadoop.hbase.coprocessor.RegionCoprocessorEnvironment; import org.apache.hadoop.hbase.regionserver.wal.WALEdit; public class postput_test extends BaseRegionObserver { @Override public void postPut(final ObserverContext<RegionCoprocessorEnvironment> e, final Put put, final WALEdit edit, final boolean writeToWAL) throws IOException { HTable table = new HTable("sunwg02"); List<KeyValue> kv = put.get("f1".getBytes(), "k1".getBytes()); Iterator<KeyValue> kvl = kv.iterator(); while(kvl.hasNext()) { KeyValue tmp = kvl.next(); Put tput = new Put(tmp.getValue()); tput.add("f1".getBytes(),"k1".getBytes(),tmp.getRow()); table.put(tput); } table.close(); }

# re: htable coprocessor使用 回復 更多評論

2013-08-09 15:33 by jxauwxj@126.com

請問一下，我試了好次，都沒成功自動創建索引。請問大神你是如何做的？謝謝

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理