ravenix

          魚如何控制自己的呼吸
          posts - 7, comments - 3, trackbacks - 0, articles - 0
            BlogJava :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

          使用dtdparser解析中文dtd

          Posted on 2005-08-22 21:02 ravenix 閱讀(1364) 評(píng)論(1)  編輯  收藏 所屬分類: XML-XSL-FO

          盡管有一些不足,wutka dtdparser 仍然是使用最廣泛的java dtd dom解析器。

          其它可用的java dtd parser有 Ronald Bourret DTD ParserMatra DTD parser

          要在DTD中使用中文,必須要在dtd文件的第一行寫上

          <?xml version="1.0" encoding="UTF-8"?>

          并且將dtd文件以u(píng)tf-8格式保存。別的編碼格式也可以試試,但我不想冒險(xiǎn)。

          dtdparser不使用這個(gè)encoding指示來解析DTD,我們只能自己想辦法,修改它的代碼。

          dtdparser有這些構(gòu)造器(省略了帶trace的)

          DTDParser(java.io.File in)
          DTDParser(java.io.Reader in)
          DTDParser(java.net.URL in)

          其中以Reader為參數(shù)的沒有編碼問題,因?yàn)閞eader本身已經(jīng)指定了字符集。

          以File為參數(shù)的構(gòu)造器內(nèi)部使用了new FileReader(in),這個(gè)方式使用系統(tǒng)默認(rèn)字符集,不要用它,可以用FileInputStream和InputStreamReader來指定字符集,傳遞給以Reader為參數(shù)的構(gòu)造器。

          以URL為參數(shù)的構(gòu)造器內(nèi)部使用了new InputStreamReader(in.openStream()),沒有指定字符集,我們可以給它增加一個(gè)帶有String charsetName參數(shù)的構(gòu)造器,內(nèi)部調(diào)用new InputStreamReader(in.openStream(), charsetName)


          評(píng)論

          # re: 使用dtdparser解析中文dtd  回復(fù)  更多評(píng)論   

          2008-02-29 16:46 by point
          請(qǐng)問您如何能不能貼出來一個(gè)修改過的供大家下載,謝謝。
          主站蜘蛛池模板: 黎城县| 河西区| 盐池县| 比如县| 柳州市| 即墨市| 延边| 苍南县| 炉霍县| 昌图县| 临沭县| 凌云县| 连南| 孟村| 政和县| 靖江市| 崇明县| 海伦市| 高碑店市| 东台市| 兴安盟| 仲巴县| 大竹县| 龙海市| 肇源县| 旬阳县| 兖州市| 杨浦区| 澎湖县| 仙居县| 子洲县| 随州市| 台北县| 舟山市| 宁明县| 泉州市| 平凉市| 阿拉善盟| 绥德县| 香河县| 读书|