隨筆 - 10, 文章 - 0, 評(píng)論 - 2, 引用 - 0
          數(shù)據(jù)加載中……

          關(guān)于 小叮咚中文分詞 .net版本發(fā)布的變化

           關(guān)于 小叮咚中文分詞  .net版本發(fā)布的變化

              現(xiàn)在幾乎每天都有朋友給我寫信,要求交流小叮咚中文分詞的實(shí)現(xiàn)。我現(xiàn)在實(shí)現(xiàn)的有java和C#兩個(gè)版本。同樣的算法邏輯,用 java 和 C#寫兩邊可不是有趣的事情 。于是自然而然想起了 關(guān)于lucene發(fā)展和多語言實(shí)現(xiàn)的方向  中采用的方法,于是決定以后主要更新java版本的中文分詞算法,而.net版本的中文分詞則在java class基礎(chǔ)上轉(zhuǎn)化過來。

              很早的時(shí)候我的一篇blog介紹過:基于.NET的Java虛擬機(jī)IKVM介紹 。于是今天就嘗試了一把,整個(gè)過程還算順利。下面是我的轉(zhuǎn)換過程:

             
              X:\ikvmbin-0.14.0.1\ikvm\bin>ikvmc -target:library X:\XXXX\chinese_sentence_splitter.jar
              Note: output file is "chinese_sentence_splitter.dll"
              Note: automatically adding reference to "e:\programming\java&.net\ikvmbin-0.14.0.1\ikvm\bin\ikvm.gnu.classpath.dll"

              通過上面的命令可以把 java jar 文件轉(zhuǎn)換成  同名的 .net dll。

              在java中測(cè)試的結(jié)果如下:

             

              但在.net中測(cè)試的結(jié)果卻不正確:

             

           

              這很顯然是IKVM.NET在轉(zhuǎn)換過程中出現(xiàn)了問題。

              由于第一次使用IKVM.NET,因此這個(gè)問題還需要在以后有時(shí)間解決一下。也希望有相關(guān)經(jīng)驗(yàn)的朋友多多指導(dǎo).


              相關(guān)連接:

                      多么樂
                      小叮咚中文分詞

          posted on 2005-05-29 21:56 我要去桂林 閱讀(585) 評(píng)論(0)  編輯  收藏


          只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。


          網(wǎng)站導(dǎo)航:
           
          主站蜘蛛池模板: 罗山县| 绍兴县| 三江| 盘锦市| 固原市| 竹溪县| 荣昌县| 太保市| 伊金霍洛旗| 全南县| 阜南县| 禹州市| 泸西县| 札达县| 洛扎县| 清远市| 新乡市| 宜丰县| 屏边| 东乌珠穆沁旗| 磐安县| 高阳县| 绥江县| 惠安县| 长岭县| 眉山市| 宝清县| 隆安县| 凉山| 启东市| 禄丰县| 朝阳区| 寻乌县| 韶关市| 乌恰县| 通河县| 施秉县| 资阳市| 乐山市| 盐源县| 五指山市|