ravenix

          魚如何控制自己的呼吸
          posts - 7, comments - 3, trackbacks - 0, articles - 0
            BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

          使用dtdparser解析中文dtd

          Posted on 2005-08-22 21:02 ravenix 閱讀(1358) 評論(1)  編輯  收藏 所屬分類: XML-XSL-FO

          盡管有一些不足,wutka dtdparser 仍然是使用最廣泛的java dtd dom解析器。

          其它可用的java dtd parser有 Ronald Bourret DTD ParserMatra DTD parser

          要在DTD中使用中文,必須要在dtd文件的第一行寫上

          <?xml version="1.0" encoding="UTF-8"?>

          并且將dtd文件以utf-8格式保存。別的編碼格式也可以試試,但我不想冒險。

          dtdparser不使用這個encoding指示來解析DTD,我們只能自己想辦法,修改它的代碼。

          dtdparser有這些構造器(省略了帶trace的)

          DTDParser(java.io.File in)
          DTDParser(java.io.Reader in)
          DTDParser(java.net.URL in)

          其中以Reader為參數的沒有編碼問題,因為reader本身已經指定了字符集。

          以File為參數的構造器內部使用了new FileReader(in),這個方式使用系統默認字符集,不要用它,可以用FileInputStream和InputStreamReader來指定字符集,傳遞給以Reader為參數的構造器。

          以URL為參數的構造器內部使用了new InputStreamReader(in.openStream()),沒有指定字符集,我們可以給它增加一個帶有String charsetName參數的構造器,內部調用new InputStreamReader(in.openStream(), charsetName)


          評論

          # re: 使用dtdparser解析中文dtd  回復  更多評論   

          2008-02-29 16:46 by point
          請問您如何能不能貼出來一個修改過的供大家下載,謝謝。
          主站蜘蛛池模板: 郧西县| 南部县| 延寿县| 东兰县| 青阳县| 潢川县| 图们市| 平原县| 饶平县| 赣州市| 锡林浩特市| 林州市| 临邑县| 锡林郭勒盟| 湾仔区| 黎平县| 沛县| 昂仁县| 涡阳县| 襄汾县| 望城县| 陈巴尔虎旗| 丽水市| 宾阳县| 洛浦县| 襄汾县| 潍坊市| 米林县| 吴堡县| 兴海县| 天祝| 和政县| 米泉市| 黎平县| 双柏县| 灵宝市| 隆昌县| 砀山县| 鹤岗市| 盐池县| 翁源县|