march alex's blog
          hello,I am march alex
          posts - 52,comments - 7,trackbacks - 0
          在之前我寫過一個英漢翻譯的java小程序EnglishChineseTranslater,今天在原來的基礎上加了一些改進。
          TranalateMaster類用于翻譯一個文件內的所有單詞。
          通過之前講到的文件操作進行文件內容的讀取,再通過StringTokenizer來分詞,最后一個一個的翻譯。
          這里有一個優化,就是通過HashMap來去重,這樣可以優化文件中一些單詞重復出現所消耗的時間。translateAll函數翻譯并直接輸出,translateAllLocal函數翻譯并保存到本地。
          import java.io.BufferedReader;
          import java.io.BufferedWriter;
          import java.io.FileReader;
          import java.io.FileWriter;
          import java.util.HashMap;
          import java.util.StringTokenizer;


          public class TranslateMaster {
              private static HashMap<String, String> map = null;
              
              public static void getWords(String filename) throws Exception {
                  map = new HashMap<String, String>();
                  BufferedReader reader = new BufferedReader(new FileReader(filename));  
                  String line = null;
                  while((line = reader.readLine()) != null){
                      StringTokenizer st = new StringTokenizer(line, ",.-!? \t");
                      while(st.hasMoreElements()) {
                          String key = st.nextToken();
                          if(map.containsKey(key) == false) {
                              try {
                                  String value = EnglishChineseTranslater.getWordName(key) + ": " + EnglishChineseTranslater.getTranslation(key);
                                  map.put(key, value);
                              } catch (Exception e) {
                                  continue;
                              }
                          }
                      }
                  }
                  reader.close();
              }
              
              public static void translateAll(String filename) throws Exception {
                  getWords(filename);
                  BufferedReader reader = new BufferedReader(new FileReader(filename));  
                  String line = null;
                  while((line = reader.readLine()) != null){
                      StringTokenizer st = new StringTokenizer(line, ",.-!? \t");
                      while(st.hasMoreElements()) {
                          String key = st.nextToken();
                          System.out.println(map.get(key));
                      }
                  }
                  reader.close();
              }
              
              public static void translateAllLocal(String inputfilename, String outputfilename) throws Exception {
                  getWords(inputfilename);
                  BufferedReader reader = new BufferedReader(new FileReader(inputfilename));  
                  BufferedWriter writer  = new BufferedWriter(new FileWriter(outputfilename));
                  String line = null;
                  while((line = reader.readLine()) != null){
                      StringTokenizer st = new StringTokenizer(line, ",.-!? \t");
                      while(st.hasMoreElements()) {
                          String key = st.nextToken();
                          writer.write(map.get(key) + "\r\n");
                          //System.out.println(map.get(key));
                      }
                  }
                  writer.close();
                  reader.close();
              }
              
              
              public static void main(String[] args) throws Exception {
                  translateAll("D:\\test.txt");
                  translateAllLocal("D:\\test.txt", "D:\\output.txt");
              }
          }
          輸入文件中的內容為:
          an apple a day,keep healthy a way.
          輸出結果顯示為:
          an: 一(在元音字母前代替不定代詞a);一任一某一;一個
          apple: 蘋果;蘋果樹;蘋果公司
          a: 一(個);每一(個);任一(個)
          day: 一天;白天;時期;節日
          keep: 保持;保留;遵守;阻止
          healthy: 健康的;健全的;大量的;有益于健康的
          a: 一(個);每一(個);任一(個)
          way: 道路;方法;方向;某方面
          posted on 2015-03-04 14:21 marchalex 閱讀(265) 評論(0)  編輯  收藏 所屬分類: java小程序
          主站蜘蛛池模板: 常山县| 衡阳县| 林甸县| 鹿泉市| 临夏市| 西林县| 西乌珠穆沁旗| 敖汉旗| 邛崃市| 班戈县| 禄丰县| 札达县| 连州市| 枣阳市| 广饶县| 舟山市| 晋州市| 大竹县| 琼海市| 固镇县| 林西县| 阿拉尔市| 施秉县| 闸北区| 曲松县| 南华县| 金寨县| 沙雅县| 濉溪县| 荣昌县| 呼图壁县| 景德镇市| 河西区| 洮南市| 峡江县| 焦作市| 柳州市| 衡山县| 醴陵市| 格尔木市| 通州区|