隨筆 - 15, 文章 - 0, 評(píng)論 - 11, 引用 - 0

          導(dǎo)航

          <2013年3月>
          242526272812
          3456789
          10111213141516
          17181920212223
          24252627282930
          31123456

          常用鏈接

          留言簿(2)

          隨筆分類

          隨筆檔案

          搜索

          •  

          最新評(píng)論

          閱讀排行榜

          評(píng)論排行榜

          使用tm-extractors-0.4.jar來(lái)讀取word文件

          package searchfileexample;

          import javax.servlet.*;
          import javax.servlet.http.*;
          import java.io.*;
          import java.util.*;
          import org.textmining.text.extraction.WordExtractor;

          public class ReadWord extends HttpServlet {
            private static final String CONTENT_TYPE = "text/html; charset=GBK";

            //Initialize global variables
            public void init() throws ServletException {
            }

            //Process the HTTP Get request
            public void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
              response.setContentType(CONTENT_TYPE);
              FileInputStream in = new FileInputStream ("D:/lfy_programe/全文檢索/SearchFileExample/a/aa.doc");
                 //  FileInputStream in = new FileInputStream ("D:/szqxjzhbase/技術(shù)測(cè)試/新建 Microsoft Word 文檔.doc");
             WordExtractor extractor = new WordExtractor();
             System.out.println(in.available());
            String str = null;
            try {
              str = extractor.extractText(in);
            }
            catch (Exception ex) {
            }
          //    System.out.println("the result length is"+str.length());
             System.out.println(str);

            }

            //Clean up resources
            public void destroy() {
            }
          }

          posted on 2008-03-18 10:33 軒轅 閱讀(5521) 評(píng)論(5)  編輯  收藏 所屬分類: java

          評(píng)論

          # re: 使用tm-extractors-0.4.jar來(lái)讀取word文件  回復(fù)  更多評(píng)論   

          謝了
          2011-04-15 13:43 | kuchoo

          # re: 使用tm-extractors-0.4.jar來(lái)讀取word文件  回復(fù)  更多評(píng)論   

          AAAAAAAAAAAAAAAAAAAAAAA
          2011-06-27 08:54 | 樓上

          # re: 使用tm-extractors-0.4.jar來(lái)讀取word文件  回復(fù)  更多評(píng)論   

          我用了怎么讀寫不了啊?
          2012-06-01 16:49 | cxf

          # re: 使用tm-extractors-0.4.jar來(lái)讀取word文件[未登錄](méi)  回復(fù)  更多評(píng)論   

          還有點(diǎn)沒(méi)有弄出來(lái)
          2013-03-26 22:01 | hades

          # re: 使用tm-extractors-0.4.jar來(lái)讀取word文件  回復(fù)  更多評(píng)論   

          java.lang.NoSuchMethodError: org.apache.poi.poifs.filesystem.POIFSFileSystem.getRoot()Lorg/apache/poi/poifs/filesystem/DirectoryEntry;
          2013-04-15 15:48 | 撒旦法
          主站蜘蛛池模板: 永宁县| 孝感市| 林口县| 福鼎市| 博湖县| 册亨县| 南皮县| 惠州市| 二手房| 湘乡市| 基隆市| 昆山市| 松滋市| 惠州市| 罗山县| 武冈市| 香格里拉县| 廊坊市| 玉龙| 阿合奇县| 二手房| 凤山县| 遂平县| 库伦旗| 那曲县| 襄城县| 祁门县| 恭城| 江永县| 运城市| 贵州省| 丰镇市| 桂阳县| 瑞丽市| 晋州市| 松溪县| 安丘市| 商水县| 仁怀市| 峨眉山市| 若羌县|