關(guān)于 小叮咚中文分詞 .net版本發(fā)布的變化
關(guān)于 小叮咚中文分詞 .net版本發(fā)布的變化
現(xiàn)在幾乎每天都有朋友給我寫信,要求交流小叮咚中文分詞的實(shí)現(xiàn)。我現(xiàn)在實(shí)現(xiàn)的有java和C#兩個(gè)版本。同樣的算法邏輯,用 java 和 C#寫兩邊可不是有趣的事情 。于是自然而然想起了 關(guān)于lucene發(fā)展和多語言實(shí)現(xiàn)的方向 中采用的方法,于是決定以后主要更新java版本的中文分詞算法,而.net版本的中文分詞則在java class基礎(chǔ)上轉(zhuǎn)化過來。
很早的時(shí)候我的一篇blog介紹過:基于.NET的Java虛擬機(jī)IKVM介紹 。于是今天就嘗試了一把,整個(gè)過程還算順利。下面是我的轉(zhuǎn)換過程:
X:\ikvmbin-0.14.0.1\ikvm\bin>ikvmc -target:library
X:\XXXX\chinese_sentence_splitter.jar
Note: output file is "chinese_sentence_splitter.dll"
Note: automatically adding reference to "e:\programming\java&.net\ikvmbin-0.14.0.1\ikvm\bin\ikvm.gnu.classpath.dll"
通過上面的命令可以把 java jar 文件轉(zhuǎn)換成 同名的 .net dll。
在java中測(cè)試的結(jié)果如下:
但在.net中測(cè)試的結(jié)果卻不正確:

這很顯然是IKVM.NET在轉(zhuǎn)換過程中出現(xiàn)了問題。
由于第一次使用IKVM.NET,因此這個(gè)問題還需要在以后有時(shí)間解決一下。也希望有相關(guān)經(jīng)驗(yàn)的朋友多多指導(dǎo).
相關(guān)連接:
多么樂小叮咚中文分詞
posted on 2005-05-29 21:56 我要去桂林 閱讀(585) 評(píng)論(0) 編輯 收藏