隨筆-8  評論-31  文章-0  trackbacks-0
          Nutch0.9 Crawl在Run的時候,有時候會出現 -


          java.lang.ArrayIndexOutOfBoundsException: -1

          at org.apache.lucene.index.MultiReader.isDeleted(MultiReader.java:
          113)

          at org.apache.nutch.indexer.DeleteDuplicates$InputFormat$DDRecordReader.next(DeleteDuplicates.java:
          176)

          at org.apache.hadoop.mapred.MapTask$
          1.next(MapTask.java:157)

          at org.apache.hadoop.mapred.MapRunner.run(MapRunner.java:
          46)

          at org.apache.hadoop.mapred.MapTask.run(MapTask.java:
          175)

          at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:
          126)

          Exception in thread 
          "main" java.io.IOException: Job failed!

          at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:
          604)

          at org.apache.nutch.indexer.DeleteDuplicates.dedup(DeleteDuplicates.java:
          439)

          at org.apache.nutch.crawl.Crawl.main(Crawl.java:
          135)

          問題的解決方法:

          https://issues.apache.org/jira/browse/NUTCH-525?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel#action_12515955



          posted on 2008-07-10 11:32 自己的小屋 閱讀(621) 評論(0)  編輯  收藏

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 明光市| 庆安县| 新建县| 平谷区| 八宿县| 乌拉特中旗| 宣城市| 渝中区| 五莲县| 炎陵县| 资中县| 旬阳县| 张掖市| 育儿| 呼伦贝尔市| 灌南县| 富裕县| 香港| 岚皋县| 田林县| 阿拉善右旗| 九江市| 柏乡县| 日喀则市| 丹寨县| 溧水县| 甘泉县| 池州市| 广元市| 抚州市| 宜良县| 泽州县| 淮北市| 宜州市| 滦平县| 盘山县| 青州市| 长岛县| 五华县| 赤壁市| 张家界市|