夢(mèng)幻e家人

java咖啡

隨筆 - 15, 文章 - 0, 評(píng)論 - 11, 引用 - 0

數(shù)據(jù)加載中……

使用tm-extractors-0.4.jar來(lái)讀取word文件

package searchfileexample;

import javax.servlet.*;
import javax.servlet.http.*;
import java.io.*;
import java.util.*;
import org.textmining.text.extraction.WordExtractor;

public class ReadWord extends HttpServlet {
private static final String CONTENT_TYPE = "text/html; charset=GBK";

//Initialize global variables
public void init() throws ServletException {
}

//Process the HTTP Get request
public void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
    response.setContentType(CONTENT_TYPE);
    FileInputStream in = new FileInputStream ("D:/lfy_programe/全文檢索/SearchFileExample/a/aa.doc");
       // FileInputStream in = new FileInputStream ("D:/szqxjzhbase/技術(shù)測(cè)試/新建 Microsoft Word 文檔.doc");
   WordExtractor extractor = new WordExtractor();
   System.out.println(in.available());
String str = null;
try {
    str = extractor.extractText(in);
}
catch (Exception ex) {
}
//    System.out.println("the result length is"+str.length());
   System.out.println(str);

}

//Clean up resources
public void destroy() {
}
}

posted on 2008-03-18 10:33 軒轅閱讀(5521) 評(píng)論(5) 編輯收藏所屬分類: java

評(píng)論

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件回復(fù) 更多評(píng)論

謝了

2011-04-15 13:43 | kuchoo

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件回復(fù) 更多評(píng)論

AAAAAAAAAAAAAAAAAAAAAAA

2011-06-27 08:54 | 樓上

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件回復(fù) 更多評(píng)論

我用了怎么讀寫不了啊？

2012-06-01 16:49 | cxf

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件[未登錄](méi) 回復(fù) 更多評(píng)論

還有點(diǎn)沒(méi)有弄出來(lái)

2013-03-26 22:01 | hades

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件 回復(fù) 更多評(píng)論

java.lang.NoSuchMethodError: org.apache.poi.poifs.filesystem.POIFSFileSystem.getRoot()Lorg/apache/poi/poifs/filesystem/DirectoryEntry;

2013-04-15 15:48 | 撒旦法

新用戶注冊(cè) 刷新評(píng)論列表


只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問(wèn) 管理
相關(guān)文章: Lucene關(guān)鍵字高亮顯示 _blank _self的含義 prototype.js開(kāi)發(fā)筆記全文檢索第二版,分別對(duì)TXT,WORD,EXCEL文件進(jìn)行了處理全文檢索使用tm-extractors-0.4.jar來(lái)讀取word文件掌控上傳進(jìn)度的AJAX Upload ajax 上傳文件程序下載java程序 jsp頁(yè)面下載程序

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件回復(fù) 更多評(píng)論

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件回復(fù) 更多評(píng)論

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件回復(fù) 更多評(píng)論

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件[未登錄](méi) 回復(fù) 更多評(píng)論

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件 回復(fù) 更多評(píng)論

夢(mèng)幻e家人

使用tm-extractors-0.4.jar來(lái)讀取word文件

評(píng)論

導(dǎo)航

常用鏈接

留言簿(2)

隨筆分類

隨筆檔案

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜

夢(mèng)幻e家人

使用tm-extractors-0.4.jar來(lái)讀取word文件

評(píng)論

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件 回復(fù) 更多評(píng)論

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件 回復(fù) 更多評(píng)論

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件 回復(fù) 更多評(píng)論

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件[未登錄](méi) 回復(fù) 更多評(píng)論

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件 回復(fù) 更多評(píng)論

導(dǎo)航

常用鏈接

留言簿(2)

隨筆分類

隨筆檔案

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件回復(fù) 更多評(píng)論

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件回復(fù) 更多評(píng)論

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件回復(fù) 更多評(píng)論

# re: 使用tm-extractors-0.4.jar來(lái)讀取word文件回復(fù) 更多評(píng)論