march alex's blog
          hello,I am march alex
          posts - 52,comments - 7,trackbacks - 0
          在之前我寫過一個英漢翻譯的java小程序EnglishChineseTranslater,今天在原來的基礎上加了一些改進。
          TranalateMaster類用于翻譯一個文件內的所有單詞。
          通過之前講到的文件操作進行文件內容的讀取,再通過StringTokenizer來分詞,最后一個一個的翻譯。
          這里有一個優化,就是通過HashMap來去重,這樣可以優化文件中一些單詞重復出現所消耗的時間。translateAll函數翻譯并直接輸出,translateAllLocal函數翻譯并保存到本地。
          import java.io.BufferedReader;
          import java.io.BufferedWriter;
          import java.io.FileReader;
          import java.io.FileWriter;
          import java.util.HashMap;
          import java.util.StringTokenizer;


          public class TranslateMaster {
              private static HashMap<String, String> map = null;
              
              public static void getWords(String filename) throws Exception {
                  map = new HashMap<String, String>();
                  BufferedReader reader = new BufferedReader(new FileReader(filename));  
                  String line = null;
                  while((line = reader.readLine()) != null){
                      StringTokenizer st = new StringTokenizer(line, ",.-!? \t");
                      while(st.hasMoreElements()) {
                          String key = st.nextToken();
                          if(map.containsKey(key) == false) {
                              try {
                                  String value = EnglishChineseTranslater.getWordName(key) + ": " + EnglishChineseTranslater.getTranslation(key);
                                  map.put(key, value);
                              } catch (Exception e) {
                                  continue;
                              }
                          }
                      }
                  }
                  reader.close();
              }
              
              public static void translateAll(String filename) throws Exception {
                  getWords(filename);
                  BufferedReader reader = new BufferedReader(new FileReader(filename));  
                  String line = null;
                  while((line = reader.readLine()) != null){
                      StringTokenizer st = new StringTokenizer(line, ",.-!? \t");
                      while(st.hasMoreElements()) {
                          String key = st.nextToken();
                          System.out.println(map.get(key));
                      }
                  }
                  reader.close();
              }
              
              public static void translateAllLocal(String inputfilename, String outputfilename) throws Exception {
                  getWords(inputfilename);
                  BufferedReader reader = new BufferedReader(new FileReader(inputfilename));  
                  BufferedWriter writer  = new BufferedWriter(new FileWriter(outputfilename));
                  String line = null;
                  while((line = reader.readLine()) != null){
                      StringTokenizer st = new StringTokenizer(line, ",.-!? \t");
                      while(st.hasMoreElements()) {
                          String key = st.nextToken();
                          writer.write(map.get(key) + "\r\n");
                          //System.out.println(map.get(key));
                      }
                  }
                  writer.close();
                  reader.close();
              }
              
              
              public static void main(String[] args) throws Exception {
                  translateAll("D:\\test.txt");
                  translateAllLocal("D:\\test.txt", "D:\\output.txt");
              }
          }
          輸入文件中的內容為:
          an apple a day,keep healthy a way.
          輸出結果顯示為:
          an: 一(在元音字母前代替不定代詞a);一任一某一;一個
          apple: 蘋果;蘋果樹;蘋果公司
          a: 一(個);每一(個);任一(個)
          day: 一天;白天;時期;節日
          keep: 保持;保留;遵守;阻止
          healthy: 健康的;健全的;大量的;有益于健康的
          a: 一(個);每一(個);任一(個)
          way: 道路;方法;方向;某方面
          posted on 2015-03-04 14:21 marchalex 閱讀(265) 評論(0)  編輯  收藏 所屬分類: java小程序
          主站蜘蛛池模板: 顺昌县| 银川市| 苏州市| 盐边县| 嵩明县| 瑞昌市| 肃南| 保靖县| 邯郸县| 高雄县| 沂源县| 辛集市| 微山县| 宜宾县| 永吉县| 广昌县| 富顺县| 仙游县| 蒙阴县| 阿坝县| 屏南县| 峡江县| 金湖县| 松原市| 寻甸| 额敏县| 营山县| 崇义县| 齐齐哈尔市| 宾川县| 宾阳县| 桦川县| 太谷县| 华容县| 和龙市| 浦东新区| 女性| 阜宁县| 萍乡市| 兴山县| 晋宁县|