隨筆 - 17  文章 - 84  trackbacks - 0
          <2007年6月>
          272829303112
          3456789
          10111213141516
          17181920212223
          24252627282930
          1234567

          如非特別說明,所有文章均為原創。如需引用,請注明出處
          Email:liangtianyu@gmail.com
          MSN:terry.liangtianyu@hotmail.com

          常用鏈接

          留言簿(4)

          隨筆分類(12)

          隨筆檔案(17)

          最新隨筆

          搜索

          •  

          積分與排名

          • 積分 - 52113
          • 排名 - 961

          最新評論

          閱讀排行榜

          評論排行榜

          經過大半個月的努力,終于完成了Lucene.Net 2.1版本的改造。經測試可以完全兼容Java版,生成的索引文件與Java版的完全一樣,查詢效率很高,不過建立索引的效率相對很低。當然,下一步我會針對相關問題進行改進。

          segment:代表一個完整的索引段
          .fnm:Document中所有Field的信息,在FieldInfos中寫入
          .fdt:存儲具有Store.YES屬性的Field的數據,包括:數量,編號和長度
          .fdx:存儲Document在.fdt中的位置
          .tis:存儲分詞后的詞條(Term)
          .tii:tis文件的索引文件,表明了每個tis文件中的詞條的位置
          .cfs:復合索引文件。建立索引時假如采取符合模式,則以上所有文件都回存儲在.cfs文件中
          posted on 2007-06-08 08:07 Terry Liang 閱讀(2095) 評論(2)  編輯  收藏 所屬分類: Lucene 2.1研究

          FeedBack:
          # re: Lucene 2.1研究:索引文件格式說明 2007-09-20 11:59 cd
          怎么才能查看cfs文件的內容,想知道到底做了哪些索引.  回復  更多評論
            
          # re: Lucene 2.1研究:索引文件格式說明 2007-09-20 12:04 Terry Liang
          @cd
          用UtraEdit或其他文本編輯器,已二進制文件打開就可以。具體格式定義我在其他文章里有詳細說明。  回復  更多評論
            
          主站蜘蛛池模板: 商洛市| 城固县| 娱乐| 横峰县| 富顺县| 茶陵县| 磐安县| 卢湾区| 阳西县| 东阿县| 屏山县| 铁力市| 阿城市| 清远市| 德令哈市| 宜阳县| 许昌市| 惠来县| 宜章县| 郴州市| 北海市| 横峰县| 永安市| 龙井市| 新田县| 绍兴市| 霍林郭勒市| 盐池县| 华亭县| 新化县| 成安县| 云龙县| 山丹县| 宣城市| 林周县| 任丘市| 龙川县| 新津县| 襄汾县| 昌都县| 丰台区|