posts - 0, comments - 77, trackbacks - 0, articles - 356
            BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

          Java實現漢字轉換為拼音

          Posted on 2007-09-07 15:21 semovy 閱讀(511) 評論(1)  編輯  收藏 所屬分類: JAVA應用

          import java.util.HashMap;
          import java.util.Iterator;
          import java.util.LinkedHashMap;
          import java.util.Set;

          public class Client {
          private static HashMap spellMap = null;

          static {
             if (spellMap == null) {
              spellMap = new LinkedHashMap(400);
             }
             initialize();
             System.out.println("Chinese transfer Spell Done.");
          }

          private Client() {
          }

          private static void spellPut(String spell, int ascii) {
             spellMap.put(spell, new Integer(ascii));
          }

          private static void initialize() {
             spellPut("a", -20319);
             spellPut("ai", -20317);
             spellPut("an", -20304);
             spellPut("ang", -20295);
             spellPut("ao", -20292);
             spellPut("ba", -20283);
             spellPut("bai", -20265);
             spellPut("ban", -20257);
             spellPut("bang", -20242);
             spellPut("bao", -20230);
             spellPut("bei", -20051);
             spellPut("ben", -20036);
             spellPut("beng", -20032);
             spellPut("bi", -20026);
             spellPut("bian", -20002);
             spellPut("biao", -19990);
             spellPut("bie", -19986);
             spellPut("bin", -19982);
             spellPut("bing", -19976);
             spellPut("bo", -19805);
             spellPut("bu", -19784);
             spellPut("ca", -19775);
             spellPut("cai", -19774);
             spellPut("can", -19763);
             spellPut("cang", -19756);
             spellPut("cao", -19751);
             spellPut("ce", -19746);
             spellPut("ceng", -19741);
             spellPut("cha", -19739);
             spellPut("chai", -19728);
             spellPut("chan", -19725);
             spellPut("chang", -19715);
             spellPut("chao", -19540);
             spellPut("che", -19531);
             spellPut("chen", -19525);
             spellPut("cheng", -19515);
             spellPut("chi", -19500);
             spellPut("chong", -19484);
             spellPut("chou", -19479);
             spellPut("chu", -19467);
             spellPut("chuai", -19289);
             spellPut("chuan", -19288);
             spellPut("chuang", -19281);
             spellPut("chui", -19275);
             spellPut("chun", -19270);
             spellPut("chuo", -19263);
             spellPut("ci", -19261);
             spellPut("cong", -19249);
             spellPut("cou", -19243);
             spellPut("cu", -19242);
             spellPut("cuan", -19238);
             spellPut("cui", -19235);
             spellPut("cun", -19227);
             spellPut("cuo", -19224);
             spellPut("da", -19218);
             spellPut("dai", -19212);
             spellPut("dan", -19038);
             spellPut("dang", -19023);
             spellPut("dao", -19018);
             spellPut("de", -19006);
             spellPut("deng", -19003);
             spellPut("di", -18996);
             spellPut("dian", -18977);
             spellPut("diao", -18961);
             spellPut("die", -18952);
             spellPut("ding", -18783);
             spellPut("diu", -18774);
             spellPut("dong", -18773);
             spellPut("dou", -18763);
             spellPut("du", -18756);
             spellPut("duan", -18741);
             spellPut("dui", -18735);
             spellPut("dun", -18731);
             spellPut("duo", -18722);
             spellPut("e", -18710);
             spellPut("en", -18697);
             spellPut("er", -18696);
             spellPut("fa", -18526);
             spellPut("fan", -18518);
             spellPut("fang", -18501);
             spellPut("fei", -18490);
             spellPut("fen", -18478);
             spellPut("feng", -18463);
             spellPut("fo", -18448);
             spellPut("fou", -18447);
             spellPut("fu", -18446);
             spellPut("ga", -18239);
             spellPut("gai", -18237);
             spellPut("gan", -18231);
             spellPut("gang", -18220);
             spellPut("gao", -18211);
             spellPut("ge", -18201);
             spellPut("gei", -18184);
             spellPut("gen", -18183);
             spellPut("geng", -18181);
             spellPut("gong", -18012);
             spellPut("gou", -17997);
             spellPut("gu", -17988);
             spellPut("gua", -17970);
             spellPut("guai", -17964);
             spellPut("guan", -17961);
             spellPut("guang", -17950);
             spellPut("gui", -17947);
             spellPut("gun", -17931);
             spellPut("guo", -17928);
             spellPut("ha", -17922);
             spellPut("hai", -17759);
             spellPut("han", -17752);
             spellPut("hang", -17733);
             spellPut("hao", -17730);
             spellPut("he", -17721);
             spellPut("hei", -17703);
             spellPut("hen", -17701);
             spellPut("heng", -17697);
             spellPut("hong", -17692);
             spellPut("hou", -17683);
             spellPut("hu", -17676);
             spellPut("hua", -17496);
             spellPut("huai", -17487);
             spellPut("huan", -17482);
             spellPut("huang", -17468);
             spellPut("hui", -17454);
             spellPut("hun", -17433);
             spellPut("huo", -17427);
             spellPut("ji", -17417);
             spellPut("jia", -17202);
             spellPut("jian", -17185);
             spellPut("jiang", -16983);
             spellPut("jiao", -16970);
             spellPut("jie", -16942);
             spellPut("jin", -16915);
             spellPut("jing", -16733);
             spellPut("jiong", -16708);
             spellPut("jiu", -16706);
             spellPut("ju", -16689);
             spellPut("juan", -16664);
             spellPut("jue", -16657);
             spellPut("jun", -16647);
             spellPut("ka", -16474);
             spellPut("kai", -16470);
             spellPut("kan", -16465);
             spellPut("kang", -16459);
             spellPut("kao", -16452);
             spellPut("ke", -16448);
             spellPut("ken", -16433);
             spellPut("keng", -16429);
             spellPut("kong", -16427);
             spellPut("kou", -16423);
             spellPut("ku", -16419);
             spellPut("kua", -16412);
             spellPut("kuai", -16407);
             spellPut("kuan", -16403);
             spellPut("kuang", -16401);
             spellPut("kui", -16393);
             spellPut("kun", -16220);
             spellPut("kuo", -16216);
             spellPut("la", -16212);
             spellPut("lai", -16205);
             spellPut("lan", -16202);
             spellPut("lang", -16187);
             spellPut("lao", -16180);
             spellPut("le", -16171);
             spellPut("lei", -16169);
             spellPut("leng", -16158);
             spellPut("li", -16155);
             spellPut("lia", -15959);
             spellPut("lian", -15958);
             spellPut("liang", -15944);
             spellPut("liao", -15933);
             spellPut("lie", -15920);
             spellPut("lin", -15915);
             spellPut("ling", -15903);
             spellPut("liu", -15889);
             spellPut("long", -15878);
             spellPut("lou", -15707);
             spellPut("lu", -15701);
             spellPut("lv", -15681);
             spellPut("luan", -15667);
             spellPut("lue", -15661);
             spellPut("lun", -15659);
             spellPut("luo", -15652);
             spellPut("ma", -15640);
             spellPut("mai", -15631);
             spellPut("man", -15625);
             spellPut("mang", -15454);
             spellPut("mao", -15448);
             spellPut("me", -15436);
             spellPut("mei", -15435);
             spellPut("men", -15419);
             spellPut("meng", -15416);
             spellPut("mi", -15408);
             spellPut("mian", -15394);
             spellPut("miao", -15385);
             spellPut("mie", -15377);
             spellPut("min", -15375);
             spellPut("ming", -15369);
             spellPut("miu", -15363);
             spellPut("mo", -15362);
             spellPut("mou", -15183);
             spellPut("mu", -15180);
             spellPut("na", -15165);
             spellPut("nai", -15158);
             spellPut("nan", -15153);
             spellPut("nang", -15150);
             spellPut("nao", -15149);
             spellPut("ne", -15144);
             spellPut("nei", -15143);
             spellPut("nen", -15141);
             spellPut("neng", -15140);
             spellPut("ni", -15139);
             spellPut("nian", -15128);
             spellPut("niang", -15121);
             spellPut("niao", -15119);
             spellPut("nie", -15117);
             spellPut("nin", -15110);
             spellPut("ning", -15109);
             spellPut("niu", -14941);
             spellPut("nong", -14937);
             spellPut("nu", -14933);
             spellPut("nv", -14930);
             spellPut("nuan", -14929);
             spellPut("nue", -14928);
             spellPut("nuo", -14926);
             spellPut("o", -14922);
             spellPut("ou", -14921);
             spellPut("pa", -14914);
             spellPut("pai", -14908);
             spellPut("pan", -14902);
             spellPut("pang", -14894);
             spellPut("pao", -14889);
             spellPut("pei", -14882);
             spellPut("pen", -14873);
             spellPut("peng", -14871);
             spellPut("pi", -14857);
             spellPut("pian", -14678);
             spellPut("piao", -14674);
             spellPut("pie", -14670);
             spellPut("pin", -14668);
             spellPut("ping", -14663);
             spellPut("po", -14654);
             spellPut("pu", -14645);
             spellPut("qi", -14630);
             spellPut("qia", -14594);
             spellPut("qian", -14429);
             spellPut("qiang", -14407);
             spellPut("qiao", -14399);
             spellPut("qie", -14384);
             spellPut("qin", -14379);
             spellPut("qing", -14368);
             spellPut("qiong", -14355);
             spellPut("qiu", -14353);
             spellPut("qu", -14345);
             spellPut("quan", -14170);
             spellPut("que", -14159);
             spellPut("qun", -14151);
             spellPut("ran", -14149);
             spellPut("rang", -14145);
             spellPut("rao", -14140);
             spellPut("re", -14137);
             spellPut("ren", -14135);
             spellPut("reng", -14125);
             spellPut("ri", -14123);
             spellPut("rong", -14122);
             spellPut("rou", -14112);
             spellPut("ru", -14109);
             spellPut("ruan", -14099);
             spellPut("rui", -14097);
             spellPut("run", -14094);
             spellPut("ruo", -14092);
             spellPut("sa", -14090);
             spellPut("sai", -14087);
             spellPut("san", -14083);
             spellPut("sang", -13917);
             spellPut("sao", -13914);
             spellPut("se", -13910);
             spellPut("sen", -13907);
             spellPut("seng", -13906);
             spellPut("sha", -13905);
             spellPut("shai", -13896);
             spellPut("shan", -13894);
             spellPut("shang", -13878);
             spellPut("shao", -13870);
             spellPut("she", -13859);
             spellPut("shen", -13847);
             spellPut("sheng", -13831);
             spellPut("shi", -13658);
             spellPut("shou", -13611);
             spellPut("shu", -13601);
             spellPut("shua", -13406);
             spellPut("shuai", -13404);
             spellPut("shuan", -13400);
             spellPut("shuang", -13398);
             spellPut("shui", -13395);
             spellPut("shun", -13391);
             spellPut("shuo", -13387);
             spellPut("si", -13383);
             spellPut("song", -13367);
             spellPut("sou", -13359);
             spellPut("su", -13356);
             spellPut("suan", -13343);
             spellPut("sui", -13340);
             spellPut("sun", -13329);
             spellPut("suo", -13326);
             spellPut("ta", -13318);
             spellPut("tai", -13147);
             spellPut("tan", -13138);
             spellPut("tang", -13120);
             spellPut("tao", -13107);
             spellPut("te", -13096);
             spellPut("teng", -13095);
             spellPut("ti", -13091);
             spellPut("tian", -13076);
             spellPut("tiao", -13068);
             spellPut("tie", -13063);
             spellPut("ting", -13060);
             spellPut("tong", -12888);
             spellPut("tou", -12875);
             spellPut("tu", -12871);
             spellPut("tuan", -12860);
             spellPut("tui", -12858);
             spellPut("tun", -12852);
             spellPut("tuo", -12849);
             spellPut("wa", -12838);
             spellPut("wai", -12831);
             spellPut("wan", -12829);
             spellPut("wang", -12812);
             spellPut("wei", -12802);
             spellPut("wen", -12607);
             spellPut("weng", -12597);
             spellPut("wo", -12594);
             spellPut("wu", -12585);
             spellPut("xi", -12556);
             spellPut("xia", -12359);
             spellPut("xian", -12346);
             spellPut("xiang", -12320);
             spellPut("xiao", -12300);
             spellPut("xie", -12120);
             spellPut("xin", -12099);
             spellPut("xing", -12089);
             spellPut("xiong", -12074);
             spellPut("xiu", -12067);
             spellPut("xu", -12058);
             spellPut("xuan", -12039);
             spellPut("xue", -11867);
             spellPut("xun", -11861);
             spellPut("ya", -11847);
             spellPut("yan", -11831);
             spellPut("yang", -11798);
             spellPut("yao", -11781);
             spellPut("ye", -11604);
             spellPut("yi", -11589);
             spellPut("yin", -11536);
             spellPut("ying", -11358);
             spellPut("yo", -11340);
             spellPut("yong", -11339);
             spellPut("you", -11324);
             spellPut("yu", -11303);
             spellPut("yuan", -11097);
             spellPut("yue", -11077);
             spellPut("yun", -11067);
             spellPut("za", -11055);
             spellPut("zai", -11052);
             spellPut("zan", -11045);
             spellPut("zang", -11041);
             spellPut("zao", -11038);
             spellPut("ze", -11024);
             spellPut("zei", -11020);
             spellPut("zen", -11019);
             spellPut("zeng", -11018);
             spellPut("zha", -11014);
             spellPut("zhai", -10838);
             spellPut("zhan", -10832);
             spellPut("zhang", -10815);
             spellPut("zhao", -10800);
             spellPut("zhe", -10790);
             spellPut("zhen", -10780);
             spellPut("zheng", -10764);
             spellPut("zhi", -10587);
             spellPut("zhong", -10544);
             spellPut("zhou", -10533);
             spellPut("zhu", -10519);
             spellPut("zhua", -10331);
             spellPut("zhuai", -10329);
             spellPut("zhuan", -10328);
             spellPut("zhuang", -10322);
             spellPut("zhui", -10315);
             spellPut("zhun", -10309);
             spellPut("zhuo", -10307);
             spellPut("zi", -10296);
             spellPut("zong", -10281);
             spellPut("zou", -10274);
             spellPut("zu", -10270);
             spellPut("zuan", -10262);
             spellPut("zui", -10260);
             spellPut("zun", -10256);
             spellPut("zuo", -10254);
          }

          /**
             * 獲得單個漢字的Ascii.
             *
             * @param cn
             *             char 漢字字符
             * @return int 錯誤返回 0,否則返回ascii
             */
          public static int getCnAscii(char cn) {
             byte[] bytes = (String.valueOf(cn)).getBytes();
             if (bytes == null || bytes.length > 2 || bytes.length <= 0) { // 錯誤
              return 0;
             }
             if (bytes.length == 1) { // 英文字符
              return bytes[0];
             }
             if (bytes.length == 2) { // 中文字符
              int hightByte = 256 + bytes[0];
              int lowByte = 256 + bytes[1];
              int ascii = (256 * hightByte + lowByte) - 256 * 256;
              return ascii;
             }
             return 0; // 錯誤
          }

          /**
             * 根據ASCII碼到SpellMap中查找對應的拼音
             *
             * @param ascii
             *             int 字符對應的ASCII
             * @return String 拼音,首先判斷ASCII是否>0&<160,如果是返回對應的字符,
             *
             * 否則到SpellMap中查找,如果沒有找到拼音,則返回null,如果找到則返回拼音.
             */
          public static String getSpellByAscii(int ascii) {
             if (ascii > 0 && ascii < 160) { // 單字符
              return String.valueOf((char) ascii);
             }

             if (ascii < -20319 || ascii > -10247) { // 不知道的字符
              return null;
             }

             Set keySet = spellMap.keySet();
             Iterator it = keySet.iterator();
             String spell0 = null;
             String spell = null;

             int asciiRang0 = -20319;
             int asciiRang;
             while (it.hasNext()) {
              spell = (String) it.next();
              Object valObj = spellMap.get(spell);
              if (valObj instanceof Integer) {
               asciiRang = ((Integer) valObj).intValue();

               if (ascii >= asciiRang0 && ascii < asciiRang) { // 區間找到
                return (spell0 == null) ? spell : spell0;
               } else {
                spell0 = spell;
                asciiRang0 = asciiRang;
               }
              }
             }

             return null;

          }

          /**
             * 返回字符串的全拼,是漢字轉化為全拼,其它字符不進行轉換
             *
             * @param cnStr
             *             String 字符串
             * @return String 轉換成全拼后的字符串
             */
          public static String getFullSpell(String cnStr) {
             if (null == cnStr || "".equals(cnStr.trim())) {
              return cnStr;
             }

             char[] chars = cnStr.toCharArray();
             StringBuffer retuBuf = new StringBuffer();
             for (int i = 0, Len = chars.length; i < Len; i++) {
              int ascii = getCnAscii(chars[i]);
              if (ascii == 0) { // 取ascii時出錯
               retuBuf.append(chars[i]);
              } else {
               String spell = getSpellByAscii(ascii);
               if (spell == null) {
                retuBuf.append(chars[i]);
               } else {
                retuBuf.append(spell);
               } // end of if spell == null
              } // end of if ascii <= -20400
             } // end of for

             return retuBuf.toString();
          }

          public static void main(String[] args) {
             String str = null;
             str = "中華人民共和國";
             System.out.println("Spell=" + Client.getFullSpell(str));

          }
          }


          評論

          # re: Java實現漢字轉換為拼音  回復  更多評論   

          2008-01-21 10:12 by 四三三
          好!正需要!謝謝
          多發好文章!
          主站蜘蛛池模板: 高碑店市| 玉溪市| 金平| 万州区| 出国| 东平县| 弋阳县| 古丈县| 德州市| 海伦市| 曲周县| 景泰县| 丹棱县| 扎鲁特旗| 大邑县| 蒙阴县| 和顺县| 方城县| 凤翔县| 通州市| 汝阳县| 吉隆县| 青海省| 永吉县| 曲阜市| 息烽县| 聂荣县| 成安县| 河曲县| 罗城| 沭阳县| 和龙市| 营口市| 社会| 那曲县| 浦县| 岱山县| 丰县| 岗巴县| 东安县| 秦皇岛市|