盡量保證每一篇文章都是我自己寫的,希望每一文章都不浪費大家的時間。

          Lucene中Field的類型

          Posted on 2007-01-26 17:36 王睿 閱讀(1323) 評論(0)  編輯  收藏 所屬分類: 搜索技術



          1.?????? 2.0 以前的版本

          • Keyword: Field 的值將被保存到索引文件,為Field的值建立索引,建立索引時不需要分詞。
          • UnIndexed: Field 的值將被保存到索引文件,不為Field的值建立索引,因此不能通過該Field搜索文檔。
          • UnStored: Field 的值不被保存到索引文件,將Field的值分詞后建立索引
          • Text: Field 的值分詞后建立索引。如果參數為String值將被保存,為Reader值不被保存

          2.?????? 2.0 版本
          ?
          用幾個內部類的組合來區分Field的具體類型。

          • Store

          2??????? COMPRESS: 壓縮保存。用于長文本或二進制數據

          2??????? YES :保存

          2??????? NO :不保存

          • Index

          2??????? NO :不 建索引

          2??????? TOKENIZED :分詞, 建索引

          2??????? UN_TOKENIZED :不分詞, 建索引

          2??????? NO_NORMS :不分詞, 建索引。但是Field的值不像通常那樣被保存,而是只取一個byte,這樣節約存儲空間

          • TermVector

          2??????? NO 不保存term vectors

          2??????? YES 保存term vectors

          2??????? WITH_POSITIONS 保存term vectors。(保存值和token位置信息)

          2??????? WITH_OFFSETS 保存term vectors。(保存值和TokenoffsetWITH_POSITIONS_OFFSETS保存term vectors。(保存值和token位置信息和Tokenoffset

          主站蜘蛛池模板: 平远县| 婺源县| 灌阳县| 那坡县| 郯城县| 富平县| 鹰潭市| 衡南县| 弥勒县| 留坝县| 峨边| 抚宁县| 克山县| 淮安市| 邳州市| 慈溪市| 巴里| 穆棱市| 广平县| 花莲市| 贵州省| 西平县| 崇仁县| 旅游| 腾冲县| 招远市| 长海县| 通海县| 余姚市| 南充市| 通州市| 正安县| 乡宁县| 道孚县| 阿坝| 长治县| 永嘉县| 扶沟县| 阳山县| 弥勒县| 类乌齐县|