隨筆 - 17  文章 - 84  trackbacks - 0
          <2007年9月>
          2627282930311
          2345678
          9101112131415
          16171819202122
          23242526272829
          30123456

          如非特別說(shuō)明,所有文章均為原創(chuàng)。如需引用,請(qǐng)注明出處
          Email:liangtianyu@gmail.com
          MSN:terry.liangtianyu@hotmail.com

          常用鏈接

          留言簿(4)

          隨筆分類(12)

          隨筆檔案(17)

          最新隨筆

          搜索

          •  

          積分與排名

          • 積分 - 52115
          • 排名 - 961

          最新評(píng)論

          閱讀排行榜

          評(píng)論排行榜

          經(jīng)過(guò)大半個(gè)月的努力,終于完成了Lucene.Net 2.1版本的改造。經(jīng)測(cè)試可以完全兼容Java版,生成的索引文件與Java版的完全一樣,查詢效率很高,不過(guò)建立索引的效率相對(duì)很低。當(dāng)然,下一步我會(huì)針對(duì)相關(guān)問(wèn)題進(jìn)行改進(jìn)。

          segment:代表一個(gè)完整的索引段
          .fnm:Document中所有Field的信息,在FieldInfos中寫入
          .fdt:存儲(chǔ)具有Store.YES屬性的Field的數(shù)據(jù),包括:數(shù)量,編號(hào)和長(zhǎng)度
          .fdx:存儲(chǔ)Document在.fdt中的位置
          .tis:存儲(chǔ)分詞后的詞條(Term)
          .tii:tis文件的索引文件,表明了每個(gè)tis文件中的詞條的位置
          .cfs:復(fù)合索引文件。建立索引時(shí)假如采取符合模式,則以上所有文件都回存儲(chǔ)在.cfs文件中
          posted on 2007-06-08 08:07 Terry Liang 閱讀(2095) 評(píng)論(2)  編輯  收藏 所屬分類: Lucene 2.1研究

          FeedBack:
          # re: Lucene 2.1研究:索引文件格式說(shuō)明 2007-09-20 11:59 cd
          怎么才能查看cfs文件的內(nèi)容,想知道到底做了哪些索引.  回復(fù)  更多評(píng)論
            
          # re: Lucene 2.1研究:索引文件格式說(shuō)明 2007-09-20 12:04 Terry Liang
          @cd
          用UtraEdit或其他文本編輯器,已二進(jìn)制文件打開(kāi)就可以。具體格式定義我在其他文章里有詳細(xì)說(shuō)明。  回復(fù)  更多評(píng)論
            
          主站蜘蛛池模板: 顺昌县| 阳信县| 临沧市| 云和县| 北安市| 泽普县| 新余市| 老河口市| 虞城县| 鄂托克旗| 合阳县| 峨山| 铁岭市| 旌德县| 青州市| 永城市| 丽江市| 湘潭市| 含山县| 新津县| 宿松县| 瑞金市| 孝义市| 巫山县| 新余市| 军事| 渭南市| 新蔡县| 偏关县| 永平县| 泰兴市| 灵武市| 金门县| 思茅市| 阳春市| 丁青县| 洪洞县| 甘南县| 德安县| 咸丰县| 宽城|