JAVA—咖啡館

          ——歡迎訪問rogerfan的博客,常來《JAVA——咖啡館》坐坐,喝杯濃香的咖啡,彼此探討一下JAVA技術,交流工作經驗,分享JAVA帶來的快樂!本網站部分轉載文章,如果有版權問題請與我聯系。

          BlogJava 首頁 新隨筆 聯系 聚合 管理
            447 Posts :: 145 Stories :: 368 Comments :: 0 Trackbacks
          漢字轉成拼音如果自己實現起來有點麻煩,主要是怕有些漢字轉不了,所以就準備使用一個開源的工具Pinyin4j.
                pinyin4j是一個支持將中文轉換到拼音的Java開源類庫,pinyin4j能夠根據中文字符獲取其對應的拼音,而且拼音的格式可以定制。pinyin4j的主頁:http://pinyin4j.sourceforge.net/
                1. 支持簡體中文和繁體中文字符;
                2. 支持轉換到漢語拼音,通用拼音, 威妥瑪拼音(威瑪拼法), 注音符號第二式, 耶魯拼法和國語羅馬字;
                3. 支持多音字,即可以獲取一個中文字符的多種發音;
                4. 支持多種字符串輸出格式,比如支持Unicode格式的字符ü和聲調符號(陰平 "ˉ",陽平"ˊ",上聲"ˇ",去聲"ˋ")的輸出。

              為了方便大家使用,我將源文件和jar包一并放上來了,歡迎大家下載。
               廢話少說,下面是我建立的一個通用類,有什么不足的地方希望大家指正。
          package com.xyj.com.tool.util;

          import net.sourceforge.pinyin4j.PinyinHelper;
          import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
          import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
          import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
          import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

          /**
           * @className:PinyingUtil.java
           * @classDescription:拼音操作工具類
           * 
          @author:xiayingjie
           * @createTime:2010-10-21
           
          */


          public class PinyingUtil {

              
          /**
               * 將字符串轉換成拼音數組
               * 
               * 
          @param src
               * 
          @return
               
          */

              
          public static String[] stringToPinyin(String src) {
                  
          return stringToPinyin(src, falsenull);
              }

              
          /**
               * 將字符串轉換成拼音數組
               * 
               * 
          @param src
               * 
          @return
               
          */

              
          public static String[] stringToPinyin(String src,String separator) {
                  
          return stringToPinyin(src, true, separator);
              }


              
          /**
               * 將字符串轉換成拼音數組
               * 
               * 
          @param src
               * 
          @param isPolyphone
               *            是否查出多音字的所有拼音
               * 
          @param separator
               *            多音字拼音之間的分隔符
               * 
          @return
               
          */

              
          public static String[] stringToPinyin(String src, boolean isPolyphone,
                      String separator) 
          {
                  
          // 判斷字符串是否為空
                  if ("".equals(src) || null == src) {
                      
          return null;
                  }

                  
          char[] srcChar = src.toCharArray();
                  
          int srcCount = srcChar.length;
                  String[] srcStr 
          = new String[srcCount];

                  
          for (int i = 0; i < srcCount; i++{
                      srcStr[i] 
          = charToPinyin(srcChar[i], isPolyphone, separator);
                  }

                  
          return srcStr;
              }


              
          /**
               * 將單個字符轉換成拼音
               * 
               * 
          @param src
               * 
          @return
               
          */

              
          public static String charToPinyin(char src, boolean isPolyphone,
                      String separator) 
          {
                  
          // 創建漢語拼音處理類
                  HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
                  
          // 輸出設置,大小寫,音標方式
                  defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
                  defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

                  StringBuffer tempPinying 
          = new StringBuffer();
                  

                  
          // 如果是中文
                  if (src > 128{
                      
          try {
                          
          // 轉換得出結果
                          String[] strs = PinyinHelper.toHanyuPinyinStringArray(src,
                                  defaultFormat);
                          
                                  
                          
          // 是否查出多音字,默認是查出多音字的第一個字符
                          if (isPolyphone && null != separator) {
                              
          for (int i = 0; i < strs.length; i++{
                                  tempPinying.append(strs[i]);
                                  
          if (strs.length != (i + 1)) {
                                      
          // 多音字之間用特殊符號間隔起來
                                      tempPinying.append(separator);
                                  }

                              }

                          }
           else {
                              tempPinying.append(strs[
          0]);
                          }


                      }
           catch (BadHanyuPinyinOutputFormatCombination e) {
                          e.printStackTrace();
                      }

                  }
           else {
                      tempPinying.append(src);
                  }


                  
          return tempPinying.toString();

              }


              
              
          public static String hanziToPinyin(String hanzi){
                  
          return hanziToPinyin(hanzi," ");
              }

              
          /**
               * 將漢字轉換成拼音
               * 
          @param hanzi
               * 
          @param separator
               * 
          @return
               
          */

              
          public static String hanziToPinyin(String hanzi,String separator){
                      
          // 創建漢語拼音處理類
                      HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
                      
          // 輸出設置,大小寫,音標方式
                      defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
                      defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
                      
                      String pinyingStr
          ="";
                      
          try {
                          pinyingStr
          =PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat, separator);
                      }
           catch (BadHanyuPinyinOutputFormatCombination e) {
                          
          // TODO Auto-generated catch block
                          e.printStackTrace();
                      }
              
                      
          return pinyingStr;
              }

              
          /**
               * 將字符串數組轉換成字符串
               * 
          @param str 
               * 
          @param separator 各個字符串之間的分隔符
               * 
          @return
               
          */

              
          public static String stringArrayToString(String[] str, String separator) {
                  StringBuffer sb 
          = new StringBuffer();
                  
          for (int i = 0; i < str.length; i++{
                      sb.append(str[i]);
                      
          if (str.length != (i + 1)) {
                          sb.append(separator);
                      }

                  }

                  
          return sb.toString();
              }

              
          /**
               * 簡單的將各個字符數組之間連接起來
               * 
          @param str
               * 
          @return
               
          */

              
          public  static String stringArrayToString(String[] str){
                  
          return stringArrayToString(str,"");
              }

              
          /**
               * 將字符數組轉換成字符串
               * 
          @param str 
               * 
          @param separator 各個字符串之間的分隔符
               * 
          @return
               
          */

              
          public static String charArrayToString(char[] ch, String separator) {
                  StringBuffer sb 
          = new StringBuffer();
                  
          for (int i = 0; i < ch.length; i++{
                      sb.append(ch[i]);
                      
          if (ch.length != (i + 1)) {
                          sb.append(separator);
                      }

                  }

                  
          return sb.toString();
              }

              
              
          /**
               * 將字符數組轉換成字符串
               * 
          @param str 
               * 
          @return
               
          */

              
          public static String charArrayToString(char[] ch) {
                  
          return charArrayToString(ch," ");
              }


              
          /**
               * 取漢字的首字母
               * 
          @param src
               * 
          @param isCapital 是否是大寫
               * 
          @return
               
          */

              
          public static char[]  getHeadByChar(char src,boolean isCapital){
                  
          //如果不是漢字直接返回
                  if (src <= 128{
                      
          return new char[]{src};
                  }

                  
          //獲取所有的拼音
                  String []pinyingStr=PinyinHelper.toHanyuPinyinStringArray(src);
                  
          //創建返回對象
                  int polyphoneSize=pinyingStr.length;
                  
          char [] headChars=new char[polyphoneSize];
                  
          int i=0;
                  
          //截取首字符
                  for(String s:pinyingStr){
                      
          char headChar=s.charAt(0);
                      
          //首字母是否大寫,默認是小寫
                      if(isCapital){
                          headChars[i]
          =Character.toUpperCase(headChar);
                       }
          else{
                          headChars[i]
          =headChar;
                       }

                      i
          ++;
                  }

                  
                  
          return headChars;
              }

              
          /**
               * 取漢字的首字母(默認是大寫)
               * 
          @param src
               * 
          @return
               
          */

              
          public static char[]  getHeadByChar(char src){
                  
          return getHeadByChar(src,true);
              }

              
          /**
               * 查找字符串首字母
               * 
          @param src 
               * 
          @return
               
          */

              
          public  static String[] getHeadByString(String src){
                  
          return getHeadByString( src, true);
              }

              
          /**
               * 查找字符串首字母
               * 
          @param src 
               * 
          @param isCapital 是否大寫
               * 
          @return
               
          */

              
          public  static String[] getHeadByString(String src,boolean isCapital){
                  
          return getHeadByString( src, isCapital,null);
              }

              
          /**
               * 查找字符串首字母
               * 
          @param src 
               * 
          @param isCapital 是否大寫
               * 
          @param separator 分隔符
               * 
          @return
               
          */

              
          public  static String[] getHeadByString(String src,boolean isCapital,String separator){
                  
          char[]chars=src.toCharArray();
                  String[] headString
          =new String[chars.length];
                  
          int i=0;
                  
          for(char ch:chars){
                      
                      
          char[]chs=getHeadByChar(ch,isCapital);
                      StringBuffer sb
          =new StringBuffer();
                      
          if(null!=separator){
                          
          int j=1;
                          
                          
          for(char ch1:chs){
                              sb.append(ch1);
                              
          if(j!=chs.length){
                                  sb.append(separator);
                              }

                              j
          ++;
                          }

                      }
          else{
                          sb.append(chs[
          0]);
                      }

                      headString[i]
          =sb.toString();
                      i
          ++;
                  }

                  
          return headString;
              }

              
              
          public static void main(String[] args) {
                  System.out.println(stringArrayToString(getHeadByString(
          "我se 心")));
              }


          }
          posted on 2010-10-25 10:40 rogerfan 閱讀(1595) 評論(0)  編輯  收藏 所屬分類: 【Java知識】
          主站蜘蛛池模板: 正镶白旗| 镇原县| 都昌县| 贡觉县| 津南区| 遂宁市| 荥阳市| 永登县| 报价| 繁峙县| 柘荣县| 遂宁市| 马公市| 射阳县| 抚松县| 太谷县| 东宁县| 太仆寺旗| 苗栗县| 砚山县| 偃师市| 双辽市| 东乡族自治县| 铜陵市| 安平县| 县级市| 临邑县| 汽车| 青州市| 大新县| 阜新市| 南木林县| 江陵县| 开远市| 黄大仙区| 东台市| 宜丰县| 晋江市| 潢川县| 汉寿县| 镇平县|