盡量保證每一篇文章都是我自己寫的,希望每一文章都不浪費(fèi)大家的時(shí)間。

          Lucene中Field的類型

          Posted on 2007-01-26 17:36 王睿 閱讀(1322) 評論(0)  編輯  收藏 所屬分類: 搜索技術(shù)



          1.?????? 2.0 以前的版本

          • Keyword: Field 的值將被保存到索引文件,為Field的值建立索引,建立索引時(shí)不需要分詞。
          • UnIndexed: Field 的值將被保存到索引文件,不為Field的值建立索引,因此不能通過該Field搜索文檔。
          • UnStored: Field 的值不被保存到索引文件,將Field的值分詞后建立索引
          • Text: Field 的值分詞后建立索引。如果參數(shù)為String值將被保存,為Reader值不被保存

          2.?????? 2.0 版本
          ?
          用幾個(gè)內(nèi)部類的組合來區(qū)分Field的具體類型。

          • Store

          2??????? COMPRESS: 壓縮保存。用于長文本或二進(jìn)制數(shù)據(jù)

          2??????? YES :保存

          2??????? NO :不保存

          • Index

          2??????? NO :不 建索引

          2??????? TOKENIZED :分詞, 建索引

          2??????? UN_TOKENIZED :不分詞, 建索引

          2??????? NO_NORMS :不分詞, 建索引。但是Field的值不像通常那樣被保存,而是只取一個(gè)byte,這樣節(jié)約存儲(chǔ)空間

          • TermVector

          2??????? NO 不保存term vectors

          2??????? YES 保存term vectors。

          2??????? WITH_POSITIONS 保存term vectors。(保存值和token位置信息)

          2??????? WITH_OFFSETS 保存term vectors。(保存值和TokenoffsetWITH_POSITIONS_OFFSETS保存term vectors。(保存值和token位置信息和Tokenoffset


          只有注冊用戶登錄后才能發(fā)表評論。


          網(wǎng)站導(dǎo)航:
           
          主站蜘蛛池模板: 绍兴县| 泸定县| 湖州市| 广东省| 达尔| 龙门县| 胶州市| 高雄县| 武冈市| 武川县| 宝清县| 清远市| 客服| 巴彦县| 合阳县| 图木舒克市| 陇南市| 曲周县| 论坛| 天津市| 伽师县| 佛坪县| 南召县| 南澳县| 辽阳县| 英超| 祁连县| 瑞昌市| 新沂市| 嘉黎县| 金寨县| 大城县| 丽江市| 汨罗市| 唐海县| 喀喇沁旗| 襄樊市| 德令哈市| 汾阳市| 慈利县| 蕉岭县|