盡量保證每一篇文章都是我自己寫的,希望每一文章都不浪費大家的時間。

          搜索的前提:建立索引

          Posted on 2007-01-30 14:10 王睿 閱讀(463) 評論(0)  編輯  收藏 所屬分類: 搜索技術



          建立索引的三大步
          index1.1.JPG

          1.?????? 數據轉換

          Lucene 只支持text格式,所以要想對其他非text格式的文檔建立索引,首先的進行轉換。轉換后生成Document對象。

          2.?????? Document 分析

          Document 分析的過程是一個規范化,去糟粕取精華的過程。比如:全部轉為小寫(Wangwang),轉為原型(runningrun),去除連接詞(aan、的)等等。

          3.?????? 寫索引文件

          以反向索引的數據結構存儲。

          主站蜘蛛池模板: 邢台县| 宜阳县| 四子王旗| 广灵县| 莲花县| 广河县| 龙江县| 土默特左旗| 大埔区| 隆回县| 朔州市| 镇雄县| 车险| 虹口区| 泉州市| 来安县| 枞阳县| 梅河口市| 佛山市| 墨玉县| 特克斯县| 永德县| 贵定县| 陆丰市| 洞口县| 濉溪县| 乐都县| 健康| 玉龙| 江门市| 涞水县| 阜新| 光泽县| 申扎县| 乳山市| 景泰县| 东阳市| 澄迈县| 巴林右旗| 高密市| 灌阳县|