笨笨的思想片斷

零碎片斷，雜七雜八。

posts - 25, comments - 79, trackbacks - 0, articles - 0

JDK 1.5 對超大字符集的支持

Posted on 2005-12-09 11:27 笨笨閱讀(3596) 評論(2) 編輯收藏所屬分類: Java

JDK 1.5 對超大字符集的支持

Unicode 與超大字符集
國標(biāo) GB18030 規(guī)定了4字節(jié)擴(kuò)展部分，這部分區(qū)域目前在 Unicode 規(guī)范中作為CJK Ext B區(qū)存在，即常說的中文超大字符集。這部分區(qū)域編碼為 \U20000 - \U2A6D6。

UTF-16與Java String/Character 對象
一個(gè)完整的 Unicode 字符叫代碼點(diǎn)/CodePoint，而一個(gè) Java char 叫代碼單元 code unit。
String 對象以UTF-16保存 Unicode 字符，需要用2個(gè)字符表示一個(gè) 超大字符集的漢字，這這種表示方式稱之為 Surrogate，第一個(gè)字符叫 Surrogate High，第二個(gè)就是 Surrogate Low。

判斷一個(gè)char是否是 Surrogate 區(qū)的字符，用 Character的 isHighSurrogate()/isLowSurrogate()方法。
從兩個(gè)Surrogate High/Low 字符，返回一個(gè)完整的 Unicode CodePoint 用 Character.toCodePoint()/codePointAt()方法。

一個(gè) Code Point ，可能需要一個(gè)也可能需要兩個(gè)char表示，因此不能直接使用 CharSequence.length()方法直接返回一個(gè)字符串到底有多少個(gè)漢字，而需要用String.codePointCount()/Character.codePointCount()。

要定位字符串中的第N個(gè)字符，不能直接將 N 作為偏移量，而需要從字符串頭部依次遍歷得到，需要用String/Character.offsetByCodePoints() 方法。

從字符串的當(dāng)前字符，找到上一個(gè)字符，也不能直接用offset -- 實(shí)現(xiàn)，而需要用 String.codePointBefore()/Character.codePointBefore()，或用 String/Character.offsetByCodePoints()

從當(dāng)前字符，找下一個(gè)字符，不能直接用 offset ++ 實(shí)現(xiàn)，需要判斷當(dāng)前 CodePoint 的長度后，再計(jì)算得到，或用 String/Character.offsetByCodePoints() 。

Swing 對超大字符集的支持
JTextPane增加了對超大字符集的支持，只要設(shè)置字體正確，就可以顯示和編輯超大字符集。

Feedback

# re: JDK 1.5 對超大字符集的支持回復(fù) 更多評論

2007-03-19 00:22 by 扇影丹青

請問怎么才能讓我的eclipse的editor和console顯示unicode增補(bǔ)字符？
好像就只能顯示到0xffff
之后的都是問號
謝謝！

# re: JDK 1.5 對超大字符集的支持 回復(fù) 更多評論

2007-03-19 13:41 by 笨笨

似乎要在 Eclipse 設(shè)置中將相關(guān)的顯示字體設(shè)置為“宋體－超大字符集”，可以試一試。

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關(guān)文章: 一個(gè)通用的文件配置框架中文全文檢索的實(shí)現(xiàn)以及一些經(jīng)驗(yàn)(Java) JVM 內(nèi)存結(jié)構(gòu)的一張小圖正則表達(dá)式說明減少全局競爭性同步，提高應(yīng)用的垂直擴(kuò)展能力 JDK 1.5 對超大字符集的支持 Java 多線程或內(nèi)存泄漏缺陷排查的一些經(jīng)驗(yàn) With or Without EJB? Java 與 C 性能比較的一些經(jīng)驗(yàn)數(shù)據(jù) Java中文&編碼問題小結(jié)

笨笨的思想片斷

導(dǎo)航

常用鏈接

留言簿(10)

我參與的團(tuán)隊(duì)

隨筆分類(25)

隨筆檔案(25)

文章分類

Bloggers

搜索

最新評論

JDK 1.5 對超大字符集的支持

Feedback

# re: JDK 1.5 對超大字符集的支持回復(fù) 更多評論

# re: JDK 1.5 對超大字符集的支持 回復(fù) 更多評論

笨笨的思想片斷

導(dǎo)航

常用鏈接

留言簿(10)

我參與的團(tuán)隊(duì)

隨筆分類(25)

隨筆檔案(25)

文章分類

Bloggers

搜索

最新評論

JDK 1.5 對超大字符集的支持

Feedback

# re: JDK 1.5 對超大字符集的支持 回復(fù) 更多評論

# re: JDK 1.5 對超大字符集的支持 回復(fù) 更多評論

# re: JDK 1.5 對超大字符集的支持回復(fù) 更多評論

# re: JDK 1.5 對超大字符集的支持回復(fù) 更多評論