march alex's blog
          hello,I am march alex
          posts - 52,comments - 7,trackbacks - 0
          在之前我寫過一個英漢翻譯的java小程序EnglishChineseTranslater,今天在原來的基礎(chǔ)上加了一些改進。
          TranalateMaster類用于翻譯一個文件內(nèi)的所有單詞。
          通過之前講到的文件操作進行文件內(nèi)容的讀取,再通過StringTokenizer來分詞,最后一個一個的翻譯。
          這里有一個優(yōu)化,就是通過HashMap來去重,這樣可以優(yōu)化文件中一些單詞重復出現(xiàn)所消耗的時間。translateAll函數(shù)翻譯并直接輸出,translateAllLocal函數(shù)翻譯并保存到本地。
          import java.io.BufferedReader;
          import java.io.BufferedWriter;
          import java.io.FileReader;
          import java.io.FileWriter;
          import java.util.HashMap;
          import java.util.StringTokenizer;


          public class TranslateMaster {
              private static HashMap<String, String> map = null;
              
              public static void getWords(String filename) throws Exception {
                  map = new HashMap<String, String>();
                  BufferedReader reader = new BufferedReader(new FileReader(filename));  
                  String line = null;
                  while((line = reader.readLine()) != null){
                      StringTokenizer st = new StringTokenizer(line, ",.-!? \t");
                      while(st.hasMoreElements()) {
                          String key = st.nextToken();
                          if(map.containsKey(key) == false) {
                              try {
                                  String value = EnglishChineseTranslater.getWordName(key) + ": " + EnglishChineseTranslater.getTranslation(key);
                                  map.put(key, value);
                              } catch (Exception e) {
                                  continue;
                              }
                          }
                      }
                  }
                  reader.close();
              }
              
              public static void translateAll(String filename) throws Exception {
                  getWords(filename);
                  BufferedReader reader = new BufferedReader(new FileReader(filename));  
                  String line = null;
                  while((line = reader.readLine()) != null){
                      StringTokenizer st = new StringTokenizer(line, ",.-!? \t");
                      while(st.hasMoreElements()) {
                          String key = st.nextToken();
                          System.out.println(map.get(key));
                      }
                  }
                  reader.close();
              }
              
              public static void translateAllLocal(String inputfilename, String outputfilename) throws Exception {
                  getWords(inputfilename);
                  BufferedReader reader = new BufferedReader(new FileReader(inputfilename));  
                  BufferedWriter writer  = new BufferedWriter(new FileWriter(outputfilename));
                  String line = null;
                  while((line = reader.readLine()) != null){
                      StringTokenizer st = new StringTokenizer(line, ",.-!? \t");
                      while(st.hasMoreElements()) {
                          String key = st.nextToken();
                          writer.write(map.get(key) + "\r\n");
                          //System.out.println(map.get(key));
                      }
                  }
                  writer.close();
                  reader.close();
              }
              
              
              public static void main(String[] args) throws Exception {
                  translateAll("D:\\test.txt");
                  translateAllLocal("D:\\test.txt", "D:\\output.txt");
              }
          }
          輸入文件中的內(nèi)容為:
          an apple a day,keep healthy a way.
          輸出結(jié)果顯示為:
          an: 一(在元音字母前代替不定代詞a);一任一某一;一個
          apple: 蘋果;蘋果樹;蘋果公司
          a: 一(個);每一(個);任一(個)
          day: 一天;白天;時期;節(jié)日
          keep: 保持;保留;遵守;阻止
          healthy: 健康的;健全的;大量的;有益于健康的
          a: 一(個);每一(個);任一(個)
          way: 道路;方法;方向;某方面
          posted on 2015-03-04 14:21 marchalex 閱讀(262) 評論(0)  編輯  收藏 所屬分類: java小程序
          主站蜘蛛池模板: 敦煌市| 抚顺县| 金阳县| 山阴县| 绍兴市| 延安市| 横峰县| 东乡县| 惠来县| 邵武市| 连山| 渭源县| 济宁市| 乾安县| 庆城县| 龙门县| 江口县| 齐河县| 根河市| 宾川县| 衡山县| 盘山县| 剑川县| 宣化县| 郧西县| 阿拉善右旗| 大化| 兴和县| 天镇县| 邯郸市| 吉木乃县| 和林格尔县| 平和县| 梓潼县| 张北县| 台北县| 澄迈县| 咸宁市| 荣成市| 沁源县| 望谟县|