鄧華

          BlogJava 聯(lián)系 聚合 管理
            48 Posts :: 0 Stories :: 149 Comments :: 0 Trackbacks

          /**
           * @(#)CnToSpell.java
           * 版權(quán)聲明 Easydozer 版權(quán)所有 違者必究
           *
           * 修訂記錄:
           * 1)更改者:Easydozer
           *   時(shí) 間:2004-10-20 
           *   描 述:創(chuàng)建
           */
          package com.easydozer.commons.util;

          import java.util.Iterator;
          import java.util.LinkedHashMap;
          import java.util.Set;

          /**
           * <pre>漢字轉(zhuǎn)化為全拼</pre>
           * <BR><DL><DT><B>JDK版本:</B></DT><BR><DD>1.4</DD></DL>
           * @author   謝計(jì)生
           * @version  1.0
           * @see     
           * @since   1.0
           */
          public class CnToSpell
          {
            private static LinkedHashMap spellMap = null;

            static
            {
              if(spellMap == null){
                spellMap = new LinkedHashMap(400);
              }
              initialize();
              System.out.println("Chinese transfer Spell Done.");
            }

            private CnToSpell()
            {
            }

            private static void spellPut(String spell,int ascii)
            {
              spellMap.put(spell,new Integer(ascii));
            }

            private static void initialize()
            {
              spellPut("a", -20319);
              spellPut("ai", -20317);
              spellPut("an", -20304);
              spellPut("ang", -20295);
              spellPut("ao", -20292);
              spellPut("ba", -20283);
              spellPut("bai", -20265);
              spellPut("ban", -20257);
              spellPut("bang", -20242);
              spellPut("bao", -20230);
              spellPut("bei", -20051);
              spellPut("ben", -20036);
              spellPut("beng", -20032);
              spellPut("bi", -20026);
              spellPut("bian", -20002);
              spellPut("biao", -19990);
              spellPut("bie", -19986);
              spellPut("bin", -19982);
              spellPut("bing", -19976);
              spellPut("bo", -19805);
              spellPut("bu", -19784);
              spellPut("ca", -19775);
              spellPut("cai", -19774);
              spellPut("can", -19763);
              spellPut("cang", -19756);
              spellPut("cao", -19751);
              spellPut("ce", -19746);
              spellPut("ceng", -19741);
              spellPut("cha", -19739);
              spellPut("chai", -19728);
              spellPut("chan", -19725);
              spellPut("chang", -19715);
              spellPut("chao", -19540);
              spellPut("che", -19531);
              spellPut("chen", -19525);
              spellPut("cheng", -19515);
              spellPut("chi", -19500);
              spellPut("chong", -19484);
              spellPut("chou", -19479);
              spellPut("chu", -19467);
              spellPut("chuai", -19289);
              spellPut("chuan", -19288);
              spellPut("chuang", -19281);
              spellPut("chui", -19275);
              spellPut("chun", -19270);
              spellPut("chuo", -19263);
              spellPut("ci", -19261);
              spellPut("cong", -19249);
              spellPut("cou", -19243);
              spellPut("cu", -19242);
              spellPut("cuan", -19238);
              spellPut("cui", -19235);
              spellPut("cun", -19227);
              spellPut("cuo", -19224);
              spellPut("da", -19218);
              spellPut("dai", -19212);
              spellPut("dan", -19038);
              spellPut("dang", -19023);
              spellPut("dao", -19018);
              spellPut("de", -19006);
              spellPut("deng", -19003);
              spellPut("di", -18996);
              spellPut("dian", -18977);
              spellPut("diao", -18961);
              spellPut("die", -18952);
              spellPut("ding", -18783);
              spellPut("diu", -18774);
              spellPut("dong", -18773);
              spellPut("dou", -18763);
              spellPut("du", -18756);
              spellPut("duan", -18741);
              spellPut("dui", -18735);
              spellPut("dun", -18731);
              spellPut("duo", -18722);
              spellPut("e", -18710);
              spellPut("en", -18697);
              spellPut("er", -18696);
              spellPut("fa", -18526);
              spellPut("fan", -18518);
              spellPut("fang", -18501);
              spellPut("fei", -18490);
              spellPut("fen", -18478);
              spellPut("feng", -18463);
              spellPut("fo", -18448);
              spellPut("fou", -18447);
              spellPut("fu", -18446);
              spellPut("ga", -18239);
              spellPut("gai", -18237);
              spellPut("gan", -18231);
              spellPut("gang", -18220);
              spellPut("gao", -18211);
              spellPut("ge", -18201);
              spellPut("gei", -18184);
              spellPut("gen", -18183);
              spellPut("geng", -18181);
              spellPut("gong", -18012);
              spellPut("gou", -17997);
              spellPut("gu", -17988);
              spellPut("gua", -17970);
              spellPut("guai", -17964);
              spellPut("guan", -17961);
              spellPut("guang", -17950);
              spellPut("gui", -17947);
              spellPut("gun", -17931);
              spellPut("guo", -17928);
              spellPut("ha", -17922);
              spellPut("hai", -17759);
              spellPut("han", -17752);
              spellPut("hang", -17733);
              spellPut("hao", -17730);
              spellPut("he", -17721);
              spellPut("hei", -17703);
              spellPut("hen", -17701);
              spellPut("heng", -17697);
              spellPut("hong", -17692);
              spellPut("hou", -17683);
              spellPut("hu", -17676);
              spellPut("hua", -17496);
              spellPut("huai", -17487);
              spellPut("huan", -17482);
              spellPut("huang", -17468);
              spellPut("hui", -17454);
              spellPut("hun", -17433);
              spellPut("huo", -17427);
              spellPut("ji", -17417);
              spellPut("jia", -17202);
              spellPut("jian", -17185);
              spellPut("jiang", -16983);
              spellPut("jiao", -16970);
              spellPut("jie", -16942);
              spellPut("jin", -16915);
              spellPut("jing", -16733);
              spellPut("jiong", -16708);
              spellPut("jiu", -16706);
              spellPut("ju", -16689);
              spellPut("juan", -16664);
              spellPut("jue", -16657);
              spellPut("jun", -16647);
              spellPut("ka", -16474);
              spellPut("kai", -16470);
              spellPut("kan", -16465);
              spellPut("kang", -16459);
              spellPut("kao", -16452);
              spellPut("ke", -16448);
              spellPut("ken", -16433);
              spellPut("keng", -16429);
              spellPut("kong", -16427);
              spellPut("kou", -16423);
              spellPut("ku", -16419);
              spellPut("kua", -16412);
              spellPut("kuai", -16407);
              spellPut("kuan", -16403);
              spellPut("kuang", -16401);
              spellPut("kui", -16393);
              spellPut("kun", -16220);
              spellPut("kuo", -16216);
              spellPut("la", -16212);
              spellPut("lai", -16205);
              spellPut("lan", -16202);
              spellPut("lang", -16187);
              spellPut("lao", -16180);
              spellPut("le", -16171);
              spellPut("lei", -16169);
              spellPut("leng", -16158);
              spellPut("li", -16155);
              spellPut("lia", -15959);
              spellPut("lian", -15958);
              spellPut("liang", -15944);
              spellPut("liao", -15933);
              spellPut("lie", -15920);
              spellPut("lin", -15915);
              spellPut("ling", -15903);
              spellPut("liu", -15889);
              spellPut("long", -15878);
              spellPut("lou", -15707);
              spellPut("lu", -15701);
              spellPut("lv", -15681);
              spellPut("luan", -15667);
              spellPut("lue", -15661);
              spellPut("lun", -15659);
              spellPut("luo", -15652);
              spellPut("ma", -15640);
              spellPut("mai", -15631);
              spellPut("man", -15625);
              spellPut("mang", -15454);
              spellPut("mao", -15448);
              spellPut("me", -15436);
              spellPut("mei", -15435);
              spellPut("men", -15419);
              spellPut("meng", -15416);
              spellPut("mi", -15408);
              spellPut("mian", -15394);
              spellPut("miao", -15385);
              spellPut("mie", -15377);
              spellPut("min", -15375);
              spellPut("ming", -15369);
              spellPut("miu", -15363);
              spellPut("mo", -15362);
              spellPut("mou", -15183);
              spellPut("mu", -15180);
              spellPut("na", -15165);
              spellPut("nai", -15158);
              spellPut("nan", -15153);
              spellPut("nang", -15150);
              spellPut("nao", -15149);
              spellPut("ne", -15144);
              spellPut("nei", -15143);
              spellPut("nen", -15141);
              spellPut("neng", -15140);
              spellPut("ni", -15139);
              spellPut("nian", -15128);
              spellPut("niang", -15121);
              spellPut("niao", -15119);
              spellPut("nie", -15117);
              spellPut("nin", -15110);
              spellPut("ning", -15109);
              spellPut("niu", -14941);
              spellPut("nong", -14937);
              spellPut("nu", -14933);
              spellPut("nv", -14930);
              spellPut("nuan", -14929);
              spellPut("nue", -14928);
              spellPut("nuo", -14926);
              spellPut("o", -14922);
              spellPut("ou", -14921);
              spellPut("pa", -14914);
              spellPut("pai", -14908);
              spellPut("pan", -14902);
              spellPut("pang", -14894);
              spellPut("pao", -14889);
              spellPut("pei", -14882);
              spellPut("pen", -14873);
              spellPut("peng", -14871);
              spellPut("pi", -14857);
              spellPut("pian", -14678);
              spellPut("piao", -14674);
              spellPut("pie", -14670);
              spellPut("pin", -14668);
              spellPut("ping", -14663);
              spellPut("po", -14654);
              spellPut("pu", -14645);
              spellPut("qi", -14630);
              spellPut("qia", -14594);
              spellPut("qian", -14429);
              spellPut("qiang", -14407);
              spellPut("qiao", -14399);
              spellPut("qie", -14384);
              spellPut("qin", -14379);
              spellPut("qing", -14368);
              spellPut("qiong", -14355);
              spellPut("qiu", -14353);
              spellPut("qu", -14345);
              spellPut("quan", -14170);
              spellPut("que", -14159);
              spellPut("qun", -14151);
              spellPut("ran", -14149);
              spellPut("rang", -14145);
              spellPut("rao", -14140);
              spellPut("re", -14137);
              spellPut("ren", -14135);
              spellPut("reng", -14125);
              spellPut("ri", -14123);
              spellPut("rong", -14122);
              spellPut("rou", -14112);
              spellPut("ru", -14109);
              spellPut("ruan", -14099);
              spellPut("rui", -14097);
              spellPut("run", -14094);
              spellPut("ruo", -14092);
              spellPut("sa", -14090);
              spellPut("sai", -14087);
              spellPut("san", -14083);
              spellPut("sang", -13917);
              spellPut("sao", -13914);
              spellPut("se", -13910);
              spellPut("sen", -13907);
              spellPut("seng", -13906);
              spellPut("sha", -13905);
              spellPut("shai", -13896);
              spellPut("shan", -13894);
              spellPut("shang", -13878);
              spellPut("shao", -13870);
              spellPut("she", -13859);
              spellPut("shen", -13847);
              spellPut("sheng", -13831);
              spellPut("shi", -13658);
              spellPut("shou", -13611);
              spellPut("shu", -13601);
              spellPut("shua", -13406);
              spellPut("shuai", -13404);
              spellPut("shuan", -13400);
              spellPut("shuang", -13398);
              spellPut("shui", -13395);
              spellPut("shun", -13391);
              spellPut("shuo", -13387);
              spellPut("si", -13383);
              spellPut("song", -13367);
              spellPut("sou", -13359);
              spellPut("su", -13356);
              spellPut("suan", -13343);
              spellPut("sui", -13340);
              spellPut("sun", -13329);
              spellPut("suo", -13326);
              spellPut("ta", -13318);
              spellPut("tai", -13147);
              spellPut("tan", -13138);
              spellPut("tang", -13120);
              spellPut("tao", -13107);
              spellPut("te", -13096);
              spellPut("teng", -13095);
              spellPut("ti", -13091);
              spellPut("tian", -13076);
              spellPut("tiao", -13068);
              spellPut("tie", -13063);
              spellPut("ting", -13060);
              spellPut("tong", -12888);
              spellPut("tou", -12875);
              spellPut("tu", -12871);
              spellPut("tuan", -12860);
              spellPut("tui", -12858);
              spellPut("tun", -12852);
              spellPut("tuo", -12849);
              spellPut("wa", -12838);
              spellPut("wai", -12831);
              spellPut("wan", -12829);
              spellPut("wang", -12812);
              spellPut("wei", -12802);
              spellPut("wen", -12607);
              spellPut("weng", -12597);
              spellPut("wo", -12594);
              spellPut("wu", -12585);
              spellPut("xi", -12556);
              spellPut("xia", -12359);
              spellPut("xian", -12346);
              spellPut("xiang", -12320);
              spellPut("xiao", -12300);
              spellPut("xie", -12120);
              spellPut("xin", -12099);
              spellPut("xing", -12089);
              spellPut("xiong", -12074);
              spellPut("xiu", -12067);
              spellPut("xu", -12058);
              spellPut("xuan", -12039);
              spellPut("xue", -11867);
              spellPut("xun", -11861);
              spellPut("ya", -11847);
              spellPut("yan", -11831);
              spellPut("yang", -11798);
              spellPut("yao", -11781);
              spellPut("ye", -11604);
              spellPut("yi", -11589);
              spellPut("yin", -11536);
              spellPut("ying", -11358);
              spellPut("yo", -11340);
              spellPut("yong", -11339);
              spellPut("you", -11324);
              spellPut("yu", -11303);
              spellPut("yuan", -11097);
              spellPut("yue", -11077);
              spellPut("yun", -11067);
              spellPut("za", -11055);
              spellPut("zai", -11052);
              spellPut("zan", -11045);
              spellPut("zang", -11041);
              spellPut("zao", -11038);
              spellPut("ze", -11024);
              spellPut("zei", -11020);
              spellPut("zen", -11019);
              spellPut("zeng", -11018);
              spellPut("zha", -11014);
              spellPut("zhai", -10838);
              spellPut("zhan", -10832);
              spellPut("zhang", -10815);
              spellPut("zhao", -10800);
              spellPut("zhe", -10790);
              spellPut("zhen", -10780);
              spellPut("zheng", -10764);
              spellPut("zhi", -10587);
              spellPut("zhong", -10544);
              spellPut("zhou", -10533);
              spellPut("zhu", -10519);
              spellPut("zhua", -10331);
              spellPut("zhuai", -10329);
              spellPut("zhuan", -10328);
              spellPut("zhuang", -10322);
              spellPut("zhui", -10315);
              spellPut("zhun", -10309);
              spellPut("zhuo", -10307);
              spellPut("zi", -10296);
              spellPut("zong", -10281);
              spellPut("zou", -10274);
              spellPut("zu", -10270);
              spellPut("zuan", -10262);
              spellPut("zui", -10260);
              spellPut("zun", -10256);
              spellPut("zuo", -10254);
            }

            /**
             * 獲得單個(gè)漢字的Ascii.
             * @param cn char
             * 漢字字符
             * @return int
             * 錯(cuò)誤返回 0,否則返回ascii
             */
            public static int getCnAscii(char cn)
            {
              byte[] bytes = (String.valueOf(cn)).getBytes();
              if(bytes == null || bytes.length > 2 || bytes.length <= 0){ //錯(cuò)誤
                return 0;
              }
              if(bytes.length == 1){ //英文字符
                return bytes[0];
              }
              if(bytes.length == 2){ //中文字符
                int hightByte = 256 + bytes[0];
                int lowByte = 256 + bytes[1];

                int ascii = (256 * hightByte + lowByte) - 256 * 256;

                //System.out.println("ASCII=" + ascii);

                return ascii;
              }

              return 0; //錯(cuò)誤
            }

            /**
             * 根據(jù)ASCII碼到SpellMap中查找對(duì)應(yīng)的拼音
             * @param ascii int
             * 字符對(duì)應(yīng)的ASCII
             * @return String
             * 拼音,首先判斷ASCII是否>0&<160,如果是返回對(duì)應(yīng)的字符,
             * <BR>否則到SpellMap中查找,如果沒(méi)有找到拼音,則返回null,如果找到則返回拼音.
             */
            public static String getSpellByAscii(int ascii)
            {
              if(ascii > 0 && ascii < 160){ //單字符
                return String.valueOf((char)ascii);
              }

              if(ascii < -20319 || ascii > -10247){ //不知道的字符
                return null;
              }

              Set keySet = spellMap.keySet();
              Iterator it = keySet.iterator();

              String spell0 = null;;
              String spell = null;

              int asciiRang0 = -20319;
              int asciiRang;
              while(it.hasNext()){

                spell = (String)it.next();
                Object valObj = spellMap.get(spell);
                if(valObj instanceof Integer){
                  asciiRang = ((Integer)valObj).intValue();

                  if(ascii >= asciiRang0 && ascii < asciiRang){ //區(qū)間找到
                    return(spell0 == null) ? spell : spell0;
                  }
                  else{
                    spell0 = spell;
                    asciiRang0 = asciiRang;
                  }
                }
              }

              return null;

            }

            /**
             * 返回字符串的全拼,是漢字轉(zhuǎn)化為全拼,其它字符不進(jìn)行轉(zhuǎn)換
             * @param cnStr String
             * 字符串
             * @return String
             * 轉(zhuǎn)換成全拼后的字符串
             */
            public static String getFullSpell(String cnStr)
            {
              if(null == cnStr || "".equals(cnStr.trim())){
                return cnStr;
              }

              char[] chars = cnStr.toCharArray();
              StringBuffer retuBuf = new StringBuffer();
              for(int i = 0,Len = chars.length;i < Len;i++){
                int ascii = getCnAscii(chars[i]);
                if(ascii == 0){ //取ascii時(shí)出錯(cuò)
                  retuBuf.append(chars[i]);
                }
                else{
                  String spell = getSpellByAscii(ascii);
                  if(spell == null){
                    retuBuf.append(chars[i]);
                  }
                  else{
                    retuBuf.append(spell);
                  } // end of if spell == null
                } // end of if ascii <= -20400
              } // end of for

              return retuBuf.toString();
            }

            public static String getFirstSpell(String cnStr)
            {
              return null;
            }

            public static void main(String[] args)
            {
              String str = null;
              str = "謝海101普降喜雨";
              System.out.println("Spell=" + CnToSpell.getFullSpell(str));
             
              str = "張牙舞爪》。,";
              System.out.println("Spell=" + CnToSpell.getFullSpell(str));
             
              str = "李鵬,可恥下場(chǎng)。";
              System.out.println("Spell=" + CnToSpell.getFullSpell(str));
             
              str = "豬油,豬八戒。";
              System.out.println("Spell=" + CnToSpell.getFullSpell(str));
            }
          }

          posted on 2006-03-16 11:55 鄧華的碎碎念 閱讀(592) 評(píng)論(0)  編輯  收藏

          只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。


          網(wǎng)站導(dǎo)航:
           
          主站蜘蛛池模板: 阿克陶县| 余干县| 新野县| 廊坊市| 灵丘县| 巴塘县| 孟州市| 虹口区| 灵宝市| 上虞市| 南投县| 葫芦岛市| 田阳县| 伽师县| 饶河县| 莱阳市| 淅川县| 陆川县| 洪江市| 吴川市| 恩施市| 天台县| 庆元县| 稷山县| 赤峰市| 民和| 县级市| 和平县| 德安县| 奇台县| 晋宁县| 泰和县| 多伦县| 昆明市| 兴城市| 阳东县| 武功县| 汾西县| 许昌市| 安宁市| 巩义市|