規律:半角空格的 charCode 為 32, 全角空格為 12288. 其他半角字符 ( 33 – 126 ) 與全
角 ( 65281 – 65374 ) 的對應關系是:均相差 65248.
代碼:
var hash = {’32’ : ’\u3000’};
// 半角轉全角
function sbc2dbc(str) {
var ret = [], i = 0, len = str.length, code, chr;
for (; i < len; ++i) {
code = str.charCodeAt(i);
chr = hash[code];
if (!chr && code > 31 && code < 127) {
chr = hash[code] = String.fromCharCode(code + 65248);
}
ret[i] = chr ? chr : str.charAt(i);
}
return ret.join(’’);
}
同理:
var hash = {’12288’ : ’ ’};
// 全角轉半角
function dbc2sbc(str) {
var ret = [], i = 0, len = str.length, code, chr;
for (; i < len; ++i) {
code = str.charCodeAt(i);
chr = hash[code];
if (!chr && code > 65280 && code < 65375) {
chr = hash[code] = String.fromCharCode(code - 65248);
}
ret[i] = chr ? chr : str.charAt(i);
}
return ret.join(’’);
}
上面的代碼會將 33 - 126 中間的符號也轉換。很多時候,這并不是 我們需要的(比如將 @ 轉換為 @)。下面的代碼侵入性更小:
var hash = {};
// 半角轉全角。僅轉換 [0-9a-zA-Z]
function sbc2dbc_w(str) {
var ret = [], i = 0, len = str.length, code, chr;
for (; i < len; ++i) {
code = str.charCodeAt(i);
chr = hash[code];
if (!chr &&
(47 < code && code < 58 ||
64 < code && code < 91 ||
96 < code && code < 123)) {
chr = hash[code] = String.fromCharCode(code + 65248);
}
ret[i] = chr ? chr : str.charAt(i);
}
return ret.join(’’);
}