隨筆 - 17  文章 - 84  trackbacks - 0
          <2007年6月>
          272829303112
          3456789
          10111213141516
          17181920212223
          24252627282930
          1234567

          如非特別說(shuō)明,所有文章均為原創(chuàng)。如需引用,請(qǐng)注明出處
          Email:liangtianyu@gmail.com
          MSN:terry.liangtianyu@hotmail.com

          常用鏈接

          留言簿(4)

          隨筆分類(12)

          隨筆檔案(17)

          最新隨筆

          搜索

          •  

          積分與排名

          • 積分 - 52113
          • 排名 - 961

          最新評(píng)論

          閱讀排行榜

          評(píng)論排行榜

          經(jīng)過(guò)大半個(gè)月的努力,終于完成了Lucene.Net 2.1版本的改造。經(jīng)測(cè)試可以完全兼容Java版,生成的索引文件與Java版的完全一樣,查詢效率很高,不過(guò)建立索引的效率相對(duì)很低。當(dāng)然,下一步我會(huì)針對(duì)相關(guān)問(wèn)題進(jìn)行改進(jìn)。

          segment:代表一個(gè)完整的索引段
          .fnm:Document中所有Field的信息,在FieldInfos中寫入
          .fdt:存儲(chǔ)具有Store.YES屬性的Field的數(shù)據(jù),包括:數(shù)量,編號(hào)和長(zhǎng)度
          .fdx:存儲(chǔ)Document在.fdt中的位置
          .tis:存儲(chǔ)分詞后的詞條(Term)
          .tii:tis文件的索引文件,表明了每個(gè)tis文件中的詞條的位置
          .cfs:復(fù)合索引文件。建立索引時(shí)假如采取符合模式,則以上所有文件都回存儲(chǔ)在.cfs文件中
          posted on 2007-06-08 08:07 Terry Liang 閱讀(2095) 評(píng)論(2)  編輯  收藏 所屬分類: Lucene 2.1研究

          FeedBack:
          # re: Lucene 2.1研究:索引文件格式說(shuō)明 2007-09-20 11:59 cd
          怎么才能查看cfs文件的內(nèi)容,想知道到底做了哪些索引.  回復(fù)  更多評(píng)論
            
          # re: Lucene 2.1研究:索引文件格式說(shuō)明 2007-09-20 12:04 Terry Liang
          @cd
          用UtraEdit或其他文本編輯器,已二進(jìn)制文件打開就可以。具體格式定義我在其他文章里有詳細(xì)說(shuō)明。  回復(fù)  更多評(píng)論
            
          主站蜘蛛池模板: 依兰县| 南郑县| 平利县| 河东区| 中西区| 瓦房店市| 绿春县| 辽源市| 安远县| 攀枝花市| 溧水县| 自治县| 黎城县| 拜泉县| 怀远县| 遂昌县| 青田县| 临武县| 滨海县| 拜泉县| 广西| 泸定县| 怀集县| 长寿区| 利川市| 江西省| 东城区| 襄樊市| 南充市| 枣庄市| 乌审旗| 榕江县| 安徽省| 弥渡县| 同仁县| 二连浩特市| 宜川县| 云林县| 社会| 巍山| 阿合奇县|