隨筆 - 17  文章 - 84  trackbacks - 0
          <2007年9月>
          2627282930311
          2345678
          9101112131415
          16171819202122
          23242526272829
          30123456

          如非特別說明,所有文章均為原創。如需引用,請注明出處
          Email:liangtianyu@gmail.com
          MSN:terry.liangtianyu@hotmail.com

          常用鏈接

          留言簿(4)

          隨筆分類(12)

          隨筆檔案(17)

          最新隨筆

          搜索

          •  

          積分與排名

          • 積分 - 52113
          • 排名 - 961

          最新評論

          閱讀排行榜

          評論排行榜

          經過大半個月的努力,終于完成了Lucene.Net 2.1版本的改造。經測試可以完全兼容Java版,生成的索引文件與Java版的完全一樣,查詢效率很高,不過建立索引的效率相對很低。當然,下一步我會針對相關問題進行改進。

          segment:代表一個完整的索引段
          .fnm:Document中所有Field的信息,在FieldInfos中寫入
          .fdt:存儲具有Store.YES屬性的Field的數據,包括:數量,編號和長度
          .fdx:存儲Document在.fdt中的位置
          .tis:存儲分詞后的詞條(Term)
          .tii:tis文件的索引文件,表明了每個tis文件中的詞條的位置
          .cfs:復合索引文件。建立索引時假如采取符合模式,則以上所有文件都回存儲在.cfs文件中
          posted on 2007-06-08 08:07 Terry Liang 閱讀(2095) 評論(2)  編輯  收藏 所屬分類: Lucene 2.1研究

          FeedBack:
          # re: Lucene 2.1研究:索引文件格式說明 2007-09-20 11:59 cd
          怎么才能查看cfs文件的內容,想知道到底做了哪些索引.  回復  更多評論
            
          # re: Lucene 2.1研究:索引文件格式說明 2007-09-20 12:04 Terry Liang
          @cd
          用UtraEdit或其他文本編輯器,已二進制文件打開就可以。具體格式定義我在其他文章里有詳細說明。  回復  更多評論
            
          主站蜘蛛池模板: 徐闻县| 崇明县| 册亨县| 平度市| 红原县| 西青区| 赤壁市| 桑日县| 杂多县| 扎赉特旗| 茂名市| 遂溪县| 岗巴县| 舟曲县| 磐安县| 方山县| 家居| 搜索| 东方市| 浦北县| 长海县| 鄂温| 波密县| 盱眙县| 杭锦旗| 浦北县| 健康| 通海县| 吉林省| 武穴市| 萨嘎县| 五常市| 兴宁市| 福贡县| 定西市| 桑植县| 岳普湖县| 平湖市| 安陆市| 平原县| 鄢陵县|