隨筆-8  評論-31  文章-0  trackbacks-0
          Nutch0.9 Crawl在Run的時候,有時候會出現 -


          java.lang.ArrayIndexOutOfBoundsException: -1

          at org.apache.lucene.index.MultiReader.isDeleted(MultiReader.java:
          113)

          at org.apache.nutch.indexer.DeleteDuplicates$InputFormat$DDRecordReader.next(DeleteDuplicates.java:
          176)

          at org.apache.hadoop.mapred.MapTask$
          1.next(MapTask.java:157)

          at org.apache.hadoop.mapred.MapRunner.run(MapRunner.java:
          46)

          at org.apache.hadoop.mapred.MapTask.run(MapTask.java:
          175)

          at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:
          126)

          Exception in thread 
          "main" java.io.IOException: Job failed!

          at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:
          604)

          at org.apache.nutch.indexer.DeleteDuplicates.dedup(DeleteDuplicates.java:
          439)

          at org.apache.nutch.crawl.Crawl.main(Crawl.java:
          135)

          問題的解決方法:

          https://issues.apache.org/jira/browse/NUTCH-525?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel#action_12515955



          posted on 2008-07-10 11:32 自己的小屋 閱讀(621) 評論(0)  編輯  收藏

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 隆昌县| 大宁县| 清苑县| 武川县| 安徽省| 萍乡市| 大同县| 澄迈县| 黔江区| 淄博市| 玛纳斯县| 鄂伦春自治旗| 台北县| 集安市| 通江县| 平谷区| 福贡县| 曲水县| 京山县| 苗栗市| 姜堰市| 泰兴市| 徐汇区| 彰化市| 南宁市| 同心县| 安龙县| 安乡县| 阜宁县| 曲水县| 天全县| 常州市| 林芝县| 白河县| 科尔| 额敏县| 宁陵县| 墨竹工卡县| 广安市| 外汇| 凉城县|