ravenix

魚如何控制自己的呼吸

posts - 7, comments - 3, trackbacks - 0, articles - 0

BlogJava :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合

:: 管理

使用dtdparser解析中文dtd

Posted on 2005-08-22 21:02 ravenix 閱讀(1364) 評(píng)論(1) 編輯收藏所屬分類: XML-XSL-FO

盡管有一些不足，wutka dtdparser 仍然是使用最廣泛的java dtd dom解析器。

其它可用的java dtd parser有 Ronald Bourret DTD Parser 和 Matra DTD parser

要在DTD中使用中文，必須要在dtd文件的第一行寫上

<?xml version="1.0" encoding="UTF-8"?>

并且將dtd文件以u(píng)tf-8格式保存。別的編碼格式也可以試試，但我不想冒險(xiǎn)。

dtdparser不使用這個(gè)encoding指示來解析DTD，我們只能自己想辦法，修改它的代碼。

dtdparser有這些構(gòu)造器（省略了帶trace的）

DTDParser(java.io.File in) DTDParser(java.io.Reader in) DTDParser(java.net.URL in)

其中以Reader為參數(shù)的沒有編碼問題，因?yàn)閞eader本身已經(jīng)指定了字符集。

以File為參數(shù)的構(gòu)造器內(nèi)部使用了new FileReader(in)，這個(gè)方式使用系統(tǒng)默認(rèn)字符集，不要用它，可以用FileInputStream和InputStreamReader來指定字符集，傳遞給以Reader為參數(shù)的構(gòu)造器。

以URL為參數(shù)的構(gòu)造器內(nèi)部使用了new InputStreamReader(in.openStream())，沒有指定字符集，我們可以給它增加一個(gè)帶有String charsetName參數(shù)的構(gòu)造器，內(nèi)部調(diào)用new InputStreamReader(in.openStream(), charsetName)

評(píng)論

# re: 使用dtdparser解析中文dtd 回復(fù) 更多評(píng)論

2008-02-29 16:46 by point

請(qǐng)問您如何能不能貼出來一個(gè)修改過的供大家下載，謝謝。

新用戶注冊(cè) 刷新評(píng)論列表


只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關(guān)文章: 設(shè)置digister不加載外部dtd，加快處理速度支持中文element的sax parser 使用dtdparser解析中文dtd 如何在CSS中使用中文定義 batik-css不是好的sac實(shí)現(xiàn)？ FOP TTFReader FileNotFoundException

ravenix

使用dtdparser解析中文dtd

評(píng)論

# re: 使用dtdparser解析中文dtd 回復(fù) 更多評(píng)論

日歷

公告

常用鏈接

留言簿(2)

隨筆分類

隨筆檔案

文章分類

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜