沙漠中的魚

          欲上天堂,先下地獄
          posts - 0, comments - 56, trackbacks - 0, articles - 119
            BlogJava :: 首頁 ::  :: 聯(lián)系 :: 聚合  :: 管理
          public class ClusteringFlyStoneDocument {

              public static void main(String[] args) {
                  
                  final Controller controller = ControllerFactory.createCachingPooling(IDocumentSource.class);
                  //創(chuàng)建需要處理的屬性對象
                  final Map<String, Object> attributes = Maps.newHashMap();
                  
                  //需要處理的文檔集合
                  List<Document> documents = SampleDocumentData.DOCUMENTS_DATA_MINING;
                  
                  //將文檔添加到聚類屬性中
                  CommonAttributesDescriptor.attributeBuilder(attributes).documents(documents);
                  
                  //設(shè)置處理的語言()
                  MultilingualClusteringDescriptor.attributeBuilder(attributes).defaultLanguage(LanguageCode.CHINESE_SIMPLIFIED);
                  
                  //設(shè)置需要處理的對象,以及聚類的算法
                  final ProcessingResult englishResult = controller.process(attributes, LingoClusteringAlgorithm.class);
                  
                  //獲取結(jié)果,打印聚類主題及關(guān)聯(lián)信息
                  final List<Cluster> clustersByTopic = englishResult.getClusters();
                  System.out.println("=======聚類主題=====");
                  for(Cluster cluster : clustersByTopic){
                      System.out.println("【主題 】" +cluster.getLabel());
                      List<Document> cDocLst = cluster.getAllDocuments();
                      for(Document doc : cDocLst){
                          System.out.println("--------" + doc.getTitle());
                      }
                  }
                   
                  //通過URL進(jìn)行聚類
                  final ProcessingResult byDomainClusters = controller.process(documents, null,ByUrlClusteringAlgorithm.class);
                  final List<Cluster> clustersByDomain = byDomainClusters.getClusters();
                  System.out.println("=======URL聚類=======");
                  for(Cluster cluster : clustersByDomain){
                      System.out.println("【URL】" +cluster.getLabel());
                      List<Document> cDocLst = cluster.getAllDocuments();
                      for(Document doc : cDocLst){
                          System.out.println("----" + doc.getTitle());
                      }
                  }
              }

          }
          主站蜘蛛池模板: 太仆寺旗| 岳西县| 万荣县| 陕西省| 启东市| 乐清市| 罗平县| 宜章县| 乌鲁木齐市| 汉中市| 辽阳市| 潜山县| 榆中县| 洱源县| 延边| 永吉县| 正镶白旗| 海林市| 辛集市| 寻甸| 若尔盖县| 武鸣县| 平顶山市| 黄山市| 乌兰县| 威远县| 枞阳县| 乌恰县| 茂名市| 长治市| 资阳市| 且末县| 漳州市| 泸溪县| 溧阳市| 三门峡市| 建水县| 铜川市| 竹北市| 精河县| 五家渠市|