??xml version="1.0" encoding="utf-8" standalone="yes"?>欧美一区二区三区日韩,中文字幕佐山爱一区二区免费,国产福利在线观看http://www.aygfsteel.com/jiabao/category/35276.html會只會i垂青有准備的hQ運氣不是每個h都有?zh-cnFri, 17 Oct 2008 02:15:11 GMTFri, 17 Oct 2008 02:15:11 GMT60Lucene倒排索引原理(? http://www.aygfsteel.com/jiabao/archive/2008/10/17/234822.html金家?/dc:creator>金家?/author>Fri, 17 Oct 2008 01:43:00 GMThttp://www.aygfsteel.com/jiabao/archive/2008/10/17/234822.htmlhttp://www.aygfsteel.com/jiabao/comments/234822.htmlhttp://www.aygfsteel.com/jiabao/archive/2008/10/17/234822.html#Feedback0http://www.aygfsteel.com/jiabao/comments/commentRss/234822.htmlhttp://www.aygfsteel.com/jiabao/services/trackbacks/234822.html 0Q设有两文?? 文章1的内容ؓQTom lives in Guangzhou,I live in Guangzhou too. 文章2的内容ؓQHe once lived in Shanghai.
2) 有了关键词后Q我们就可以建立倒排索引了。上面的对应关系是:“文章号”对“文章中所有关键词”。倒排索引把这个关pd过来,变成Q“关键词”对“拥有该关键词的所有文章号”。文?Q?l过倒排后变?br />关键词 文章号 guangzhou 1 he 2 i 1 live 1,2 shanghai 2 tom 1
通常仅知道关键词在哪些文章中出现q不够,我们q需要知道关键词在文章中出现ơ数和出现的位置Q通常有两U位|:a)字符位置Q即记录该词是文章中W几个字W(优点是关键词亮显时定位快Q;b)关键词位|,卌录该词是文章中第几个关键词(优点是节U烦引空间、词l(phaseQ查询快Q,lucene中记录的是q种位置?br /> 加上“出现频率”和“出C|”信息后Q我们的索引l构变ؓQ?br />关键词 文章号[出现频率] 出现位置 guangzhou 1[2] 3Q? he 2[1] 1 i 1[1] 4 live 1[2],2[1] 2Q?Q? shanghai 2[1] 3 tom 1[1] 1