国产一区二区三区四区五区3d ,欧美精品一区二区三区在线四季,在线看的网站你懂

索引技術(shù)

    當(dāng)文本信息庫(kù)的容量很大時(shí)，如果要快速有效的獲取文本，那么就需要使用特定的索引技術(shù)，一種簡(jiǎn)單而且常用的文本索引結(jié)構(gòu)是倒排文件。如果搜索過(guò)程是以簡(jiǎn)單的單詞匹配實(shí)施的，那么基于倒排文件的索引結(jié)構(gòu)就能滿足這回總需求。這種基于單詞匹配的查詢方式在目前的信息獲取系統(tǒng)中用得比較普遍。

    一個(gè)典型的倒排文件由如下幾部分組成：

（1）一個(gè)包含信息庫(kù)中的文本中所有不同單詞（也叫作詞匯表）的向量；

（2）對(duì)于詞匯表中的每個(gè)單詞，有一種包含這個(gè)單詞的所有文檔（用文檔號(hào)來(lái)標(biāo)識(shí)）組成的列表。每個(gè)列表中的文檔根據(jù)文檔號(hào)的大小升序排列。查詢執(zhí)行的時(shí)間與訪問(wèn)索引所需要的時(shí)間密切相關(guān)。

發(fā)表于 2005-11-09 21:27 Search Engine 閱讀(1089) 評(píng)論(1) 編輯收藏所屬分類: 學(xué)習(xí)總結(jié)

評(píng)論

# re: 索引技術(shù)

你好，我現(xiàn)在很想學(xué)習(xí)一下倒排索引技術(shù)，可以介紹幾本書(shū)籍給我嗎？或者您在實(shí)現(xiàn)INVERS INDEX 與 NEXTWORD INDEX 及 HIERARCHICAL INDEX給我些建議嗎？急待您的回復(fù)！謝謝

可幽依布嗒評(píng)論于 2006-05-13 21:24 回復(fù) 更多評(píng)論

新用戶注冊(cè) 刷新評(píng)論列表


只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問(wèn) 管理
相關(guān)文章: Nutch-開(kāi)源搜索引擎 google 的PR算法轉(zhuǎn)載 lucene 二轉(zhuǎn)載lucene 一索引技術(shù)

友情鏈接

搜索

最新評(píng)論

1.?re: google 的PR算法
怎么不寫(xiě)多點(diǎn)關(guān)于PR算法，
--gucci
2.?re: google 的PR算法
學(xué)習(xí)了
--輸送帶
3.?re: Nutch-開(kāi)源搜索引擎
評(píng)論內(nèi)容較長(zhǎng),點(diǎn)擊標(biāo)題查看
--liva
4.?re: 索引技術(shù)
評(píng)論內(nèi)容較長(zhǎng),點(diǎn)擊標(biāo)題查看
--可幽依布嗒

閱讀排行榜

評(píng)論排行榜

索引技術(shù)

導(dǎo)航

統(tǒng)計(jì)

常用鏈接

留言簿(1)

隨筆分類

隨筆檔案

友情鏈接

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜