隨筆 - 3, 文章 - 152, 評論 - 17, 引用 - 0
          數據加載中……

          用JDOM處理XML文檔

          用JDOM處理XML文檔

          發布日期:2002-04-09 作者:AYellow 閱讀人次:4736
           
          用JDOM處理XML文檔

          關鍵詞:Java、JDOM、XML、JAXB
          歡迎與我討論(boyofjava@sina.com)

          (一)JDOM的介紹以及與JAXB的比較

          Java + XML = JDOM !
          這就是JDOM設計者的目標。如果你曾經使用過煩人的SAX或是DOM來處理XML,你就會知道為什么要有JDOM或者是JAXB。在今年(2002)的JavaOne會議上JDOM的主要創始人Jason Hunter有一篇精彩的演講介紹了JDOM技術,題目就是JDOM Makes XML Easy。
          在那篇文檔里,JDOM被拿來與DOM比較,而我更愿意拿它同JAXB比較。因為JAXB和JDOM都是為了在Java中提供比DOM和SAX更為方便的XML處理接口而開發的,并且通過完全不同的途徑來解決這個問題。JDOM的處理方式是與DOM類似的樹操作。而JAXB通過DTD和綁定模式來生成訪問XML文檔的Java代碼,將XML映射成了Java對象來操作。你可以根據項目的需要和個人喜好來決定采用哪一個。
          JDOM與JAXB的比較,從本身的特點來看:
          1)    JDOM比JAXB更容易上手。使用JAXB首先要會編寫DTD,然后還要會編寫綁定模式。JDOM沒有這樣的要求,如果你會Java和XML,甚至可以說光是看JDOM的javadoc文檔就能夠使用JDOM。
          2)    JAXB編寫好DTD和綁定模式以后,XML文檔被映射成了Java對象,其數據就是Java對象的屬性,連數據類型都做好了轉換,因此,訪問XML文檔比JDOM要簡便,可以說是一勞永逸。
          3)    JAXB由某個DTD和綁定模式生成的代碼只能訪問該DTD所約束的文檔。如果想要訪問其他XML文檔,需要再編寫DTD和綁定模式。JDOM可以處理任何XML文檔,包括受約束的和不受約束的。

          目前JDOM和JAXB都沒有正式版本。JDOM的最新版本是beta8,JAXB是1.0 early access,其規范版本是0.21。相對而言,JDOM更成熟一些。例如JAXB不支持名字空間、不能向XML文檔寫入處理指令,有時我們需要保留的換行符和首尾空格在JAXB中自動過濾掉了,就連放在<![CDATA[ 和 ]]>里面也不能幸免。JDOM就沒有這些限制。如果說以上的3點比較是JDOM和JAXB本身的特點所決定的,幾乎不可能改變,那么這里表明,JAXB還需要更多的工作。

          (二)獲得并安裝JDOM
          在http://jdom.org可以下載JDOM的最新版本。以JDOM beta8的2進制版本為例。下載后解壓縮,JDOM的jar文件就是build目錄下的文件jdom.jar,將之加入類路徑。另外JDOM還需要lib目錄下那些jar文件如xerces.jar的支持。如果在使用中出現以下錯誤:
          java.lang.NoSuchMethodError
          或 
          java.lang.NoClassDefFoundError: org/xml/sax/SAXNotRecognizedException
          你需要保證xerces.jar文件在CLASSPATH中位于其他XML類,如JAXP或Crimson之前,這些類文件,包括以前老版本的xerces,可能不支持SAX2.0或DOM Level 2。于是導致了上面的錯誤。

          (三)一個簡單的例子
          JDOM的處理方式有些類似于DOM,但它主要是用SAX實現的,你不必擔心處理速度和內存的問題。另外,JDOM中幾乎沒有接口,的類全部是實實在在的類,沒有類工廠類的。其最重要的一個包org.jdom中主要有以下類:
          ? Attribute
          ? CDATA
          ? Comment
          ? DocType
          ? Document
          ? Element
          ? EntityRef
          ? Namespace
          ? ProcessingInstruction
          ?    Text
          數據輸入要用到XML文檔要通過org.jdom.input包,反過來需要org.jdom.output。如前面所說,關是看API文檔就能夠使用。
          我們的例子讀入XML文件exampleA.xml,加入一條處理指令,修改第一本書的價格和作者,并添加一條屬性,然后寫入文件exampleB.xml:
          //exampleA.xml
          <?xml version="1.0" encoding="GBK"?>
          <bookList>
              <book>
                  <name>Java編程入門</name>
                  <author>張三</author>
                  <publishDate>2002-6-6</publishDate>
                  <price>35.0</price>
              </book>
              <book>
                  <name>XML在Java中的應用</name>
                  <author>李四</author>
                  <publishDate>2002-9-16</publishDate>
                  <price>92.0</price>
              </book>
          </bookList>

          //testJDOM.java
          import org.jdom.*;
          import org.jdom.output.*;
          import org.jdom.input.*;
          import java.io.*;
          public class TestJDOM{
              public static void main(String args[])throws Exception{
                  
                  SAXBuilder sb = new SAXBuilder();

                  //從文件構造一個Document,因為XML文件中已經指定了編碼,所以這里不必了
                  Document doc = sb.build(new FileInputStream("exampleA.xml"));
                  
                  //加入一條處理指令\
                  ProcessingInstruction pi = new ProcessingInstruction
                      ("xml-stylesheet","href=\"bookList.html.xsl\" type=\"text/xsl\"");
                  doc.addContent(pi);


                  Element root = doc.getRootElement(); //得到根元素
                  java.util.List books = root.getChildren(); //得到根元素所有子元素的集合
                  Element book = (Element)books.get(0); //得到第一個book元素
                  //為第一本書添加一條屬性
                  Attribute a = new Attribute("hot","true");  
                  book.setAttribute(a);
                  Element author = book.getChild("author"); //得到指定的字元素
                  author.setText("王五\\"); //將作者改為王五
                  //或 Text t = new Text("王五\\");book.addContent(t);
                  Element price = book.getChild("price"); //得到指定的字元素
                  //修改價格,比較郁悶的是我們必須自己轉換數據類型,而這正是JAXB的優勢
                  author.setText(Float.toString(50.0f)); 
                  


                  String indent = "    ";
                  boolean newLines = true;
                  XMLOutputter outp = new XMLOutputter(indent,newLines,"GBK");
                  outp.output(doc, new FileOutputStream("exampleB.xml"));

              }
          };

          執行結果exampleB.xml:
          <?xml version="1.0" encoding="GBK"?>
          <bookList>
              <book hot=”true”>
                  <name>Java編程入門</name>
                  <author>50.0</author>
                  <publishDate>2002-6-6</publishDate>
                  <price>35.0</price>
              </book>
              <book>
                  <name>XML在Java中的應用</name>
                  <author>李四</author>
                  <publishDate>2002-9-16</publishDate>
                  <price>92.0</price>
              </book>
          </bookList>
          <?xml-stylesheet href="bookList.html.xsl" type="text/xsl"?>

          在默認情況下,JDOM的Element類的getText()這類的方法不會過濾空白字符,如果你需要過濾,用setTextTrim() 。


          (四)參考文檔
          1)    JDOM Makes XML Easy (http://www.servlets.com/speaking/jdom-javaone.pdf)
          2)    The Java &#8482; Architecture for XML Binding User’s Guide (http://java.sun.com/xml/jaxb/jaxb-docs.pdf)
          3)    Web Services Made Easier. The Java TM APIs and Architectures for XML, A Technical White Paper (http://java.sun.com/xml/webservices.pdf )





           
          整理發布:umbrella

          posted on 2005-03-23 13:08 閱讀(300) 評論(0)  編輯  收藏 所屬分類: Java_Xml

          主站蜘蛛池模板: 龙江县| 林州市| 阿拉善盟| 武鸣县| 安义县| 福海县| 宜昌市| 乌兰浩特市| 肇源县| 波密县| 大渡口区| 富顺县| 紫金县| 五河县| 蓬安县| 沙洋县| 沭阳县| 兴化市| 桃园市| 盐源县| 醴陵市| 辽阳县| 阿拉尔市| 安康市| 佛坪县| 淄博市| 康马县| 松阳县| 莎车县| 濉溪县| 剑阁县| 隆尧县| 上饶县| 合川市| 新巴尔虎右旗| 盐边县| 九寨沟县| 南靖县| 昭平县| 渝北区| 台山市|