隨筆-18  評論-20  文章-0  trackbacks-0

          Java有多種方法可以分析XML文檔,你可以選擇現在已經成熟的標準技術,比如DOM和SAX,或者你可以選擇專用于處理XML的Java API (Java API for XML Processing,JAXP)。

          JAXP是一種專門提供XML文檔解析的Java接口,下面我們就來研究一下如何使用Apache Xerces-2 解析器來實現JAXP。

          工廠模式

          JAXP提供了一種DOM及SAX方式的解析器來處理XML文檔,也就是工廠模式。你選擇不同的工廠類就會有不同的處理方法。工廠類實際上是一個標準設計模式,你可以根據需要自行修改。

          利用JAXP,你可以使用DocumentBuilderFactory來建立自己的DocumentBuilder類,或者使用SAXParserFactory來建立自己的SAXParser類。不同之處就在于DOM解析器是將整個文檔讀入內存并允許你以隨機方式讀取文檔,而SAX解析器是通過呼叫句柄來解釋XML文檔數據的。下面我們仔細研究一下DocumentBuilder類。

          DocumentBuilder類

          通過在DocumentBuilderFactory類中呼叫newDocumentBuilder方法,我們可以建立一個DocumentBuilder類。你可以通過呼叫newInstance方法來建立多個DocumentBuilderFactory類。

          例如,你可以這樣建立一個新的DocumentBuilderFactory類:

          DocumentBuilderFactorydbfactory = DocumentBuilderFactory.newInstance();

          一旦有了工廠類的句柄,你就可以馬上建立一個DOM解析器的實例了。下面是建立代碼:

          DocumentBuilder builder = dbfactory. newDocumentBuilder();

          這樣我們就建立了一個真正的DocumentBuilder類的實例。為了解析文檔,你必須調用DocumentBuilder類的解析方法。解析方法會返回一個Document對象,就是你要操作的XML文檔。

          Listing A實現了一個簡單的利用DocumentBuilderFactory和DocumentBuilder類的方法:

          Listing A:

          JAXPSample.java
          import javax.xml.parsers.*;
          import org.w3c.dom.*;

          public class JAXPSample {

            public static void main(String[] args) {
              String filename = "sample.xml";
                   
              try {
                DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
                DocumentBuilder parser = factory.newDocumentBuilder();
                Document d = parser.parse(filename);
              }
              catch (Exception e) {
                System.err.println("Exception: " + e.getMessage());
              }
            
            }
          }

          DocumentBuilder類其實就是一個DOM解析器。利用JAXP的DocumentBuilder類的優勢就在于它比其他XML解析器更輕便。

          真實的文檔

          當通過DocumentBuilder接口使用DOM時,解析器會返回一個Document類。這個Document類很重要,因為它是完全符合W3C標準的,這意味這你可以將這個Document類和其他DOM解析器良好的結合起來。

          例如你可以通過以下代碼找回元素值:

          String getXMLValue(Document doc, String name) {     
               NodeListnlist=doc.getElementsByTagName(name);
               String value = nlist.item(0).getFirstChild().getNodeValue();
               return value;
          }

          這個方法用來尋找文檔內與字符串一致的子節點。


           

          以Sun公司的JAXP為例來看看其中和DOM相關的包:

          DOM包結構

             org.w3c.com:定義了DOM的接口。這是w3c所指制定的DOM規范,因為DOM規范是與語言無關的,因而其中只是定義了接口,而沒有實現任何地類。任何具體的DOM實現需要有其它的類庫給出。

             javax.xml.parser:定義了DocumentBuilderFactory類DocumentBuilder類。編程時用DocumentBuilderFactory來生成一個具體的和具體的類庫相聯系的DocumentBuilder類的實例,然后再由這個DocumentBuilder對象來生成一個Document實例。Document對象中就包含了DOM的樹模型結構,是DOM模型的根。同SAXParserFactory一樣,具體的DocumentBuilder對象的建立,取決于一個環境變量javax.xml.parsers.DocumentBuilderFactory的值,同樣的,也可以直接把類名傳遞給DocumentBuilderFactory來建立一個DocumentBuilder。

             com.sun.xml.tree:Sun的Java XML的DOM實現,他對標準的DOM提供了一些擴展,其中大部分的東西并不是DOM標準。包括了XMLDocument,ElementNode, XMLDocumentBuilder和TreeWalker等類。XMLDocument類實現了DOM的Document界面,它同樣也提供了靜態的工廠方法來建立一個Document對象。ElementNode類代表了在一個DOM樹中的每一個節點元素,并且它經常被繼承,來實現一些自定的功能。 而XMLDocumentBuilder實際上是一個DocumentHandler類型的類,也就是說,它接受一個SAX解析器傳遞過來的事件,然后根據這些事件來在內存中建立一個DOM模型。

          DOM處理過程

             DOM的處理過程相對SAX而言要簡單些,先用DocumentBuilderFactory的靜態方法newInstance()建立一個DocumentBuilderFactory的實例,然后用它的newDocumentBuilder()方法建立一個DocumentBuilder。然后可以用DocumentBuilder的parser()方法來解析一個XML文檔并建立DOM模型。在JAXP中還提供了更為方便的功能擴展,就是使用XMLDocument。你可以為一個SAX解析器注冊一個事件處理器XMLDocumentBuilder,在解析過后,可以調用XMLDocumentBuilder的getDocument()方法就可以把一個外在地XML文檔轉換成一個內存中的DOM樹了,并生成一個Document(XMLDocument)對象,后面的工作,就是調用XMLDocument對象和ElementNode對象的各個方法來對DOM樹進行操作了。最后,還可以調用XMLDocument的wirte()方法來把DOM樹輸出為XML文件。因為在標準的DOM模型中并沒有提供與write()相類似的方法,所以要處理輸出的話,用XMLDocument會更方便些。

          實例DOM

             下面我們可以來看看例子了。

          首先當然是import語句:


             import javax.xml.parsers.DocumentBuilderFactory; 

             import javax.xml.parsers.FactoryConfigurationError; 

             import javax.xml.parsers.ParserConfigurationException;

             import javax.xml.parsers.DocumentBuilder;
             為了能給你更多的印象,我詳細內出了所有的類,實際上你只需要一句就可以了:

          import javax.xml.parsers.*;

          你還需要的是W3C對DOM和DOM例外的定義:

          import org.w3c.dom.Document; import org.w3c.dom.DOMException;
          還有一些其他的用來進行例外和I/O處理的類:


             import org.xml.sax.SAXException; 

             import org.xml.sax.SAXParseException;

             import java.io.File;

             import java.io.IOException;



             因為要輸出XML文檔,所以還要引入XMLDocument:



             import com.sun.xml.tree.XmlDocument; 

             public class DomEcho{



             在程序邏輯中,因為要處理DOM模型,所以當然首先應該申明一個Document對象:



             static Document document;

             public static void main (String argv [])

             {

              if (argv.length != 1) {

                         System.err.println ("Usage: java DomEcho filename");

                         System.exit (1);

                     }
             用DocumentBuilderFactory類的靜態方法newInstance()來創建一個工廠實例,之所以稱為工廠,是由于再這兒應用到了設計模式(Design Pattern)中的工廠模式,實際上在Java類庫中設計模式的范例隨處可見,如果能夠對設計模式有一些了解,就會很容易為Java龐雜的類庫理出一條條脈絡分明的經線。
                    DocumentBuilderFactory factory =

                        DocumentBuilderFactory.newInstance();

                     try {

                        DocumentBuilder builder = factory.newDocumentBuilder();

                        document = builder.parse( new File(argv[0]) );
             前面說過,DOM標準模型中并沒有定義輸出的接口,因而如果需要進行文檔輸出的話,就需要用到JAXP的擴展,使用到XmlDocument。這兒有一個較為簡便的方法,就是用強制類型轉換,把一個Document類轉換成XmlDocument,然后,就可以使用XmlDocument的write()方法了:
                       XmlDocument xdoc = (XmlDocument) document;

                        xdoc.write (System.out);
             在后面的都是例外的處理了,在DOM中雖然有定義了DOMException,但是DOMException只是用在遍歷和操作DOM樹時引發的例外。在解析文檔和初始化解析器時所引發的例外,還是借助于SAX中的例外處理方法,以使程序上具有一致性:

                     } catch (SAXParseException spe) {

                          // 處理解析過程中生成的例外

                        System.out.println ("\n** Parsing error"

                           + ", line " + spe.getLineNumber ()

                           + ", uri " + spe.getSystemId ());

                        System.out.println("   " + spe.getMessage() );

                        Exception  x = spe;

                        if (spe.getException() != null)

                            x = spe.getException();

                        x.printStackTrace();

                     } catch (SAXException sxe) {

                        // 處理一般的程序例外或者解析器初始化時引發的例外

                        Exception  x = sxe;

                        if (sxe.getException() != null)

                            x = sxe.getException();

                        x.printStackTrace();

                     } catch (IOException ioe) {

                        // IO例外

                        ioe.printStackTrace();

                     }

                 }

             這而對DOM講的比較簡略,但是基本的程序結構我們已經可以從中看出來了。

           DOM jdk幫助

          posted on 2007-08-17 09:36 JavaPoint 閱讀(1156) 評論(0)  編輯  收藏 所屬分類: Java
          主站蜘蛛池模板: 衢州市| 邹平县| 循化| 克山县| 沙田区| 福贡县| 庆云县| 广昌县| 关岭| 扎囊县| 灌南县| 仙桃市| 六盘水市| 霍邱县| 禹城市| 西林县| 伊宁市| 河曲县| 金寨县| 内丘县| 额尔古纳市| 东丰县| 图们市| 肇源县| 河东区| 阿图什市| 马关县| 湘潭市| 莱阳市| 泌阳县| 稷山县| 齐河县| 安岳县| 吕梁市| 内乡县| 武山县| 广水市| 永州市| 华坪县| 合阳县| 古交市|