首頁(yè) 新隨筆新文章聯(lián)系聚合

posts - 26,comments - 27,trackbacks - 0

2025年6月

>

日

一

二

三

四

五

六

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

常用鏈接

留言簿(1)

隨筆分類(lèi)

日語(yǔ)學(xué)習(xí)

隨筆檔案

文章分類(lèi)

文章檔案

相冊(cè)

NBA

我的收藏

李云 blog
【翻譯】EJB3.1真的來(lái)了嗎？EJB3.1系列文章(一)
1.hourfor.me
beansoft's blog
CSDN JAVA 頻道
EXCEL學(xué)習(xí)
javascript 九陰真經(jīng)
JBoss 4.0.2集群指南
JBOSS 集群負(fù)載均衡
JBoss的集群策略分析(sateless ejb)
JDON
ORACLE STUDY
Sun NetBeans 博客大賽全球前十名
SUN 學(xué)習(xí)
UML軟件工程組織
周培源

搜索

閱讀排行榜

1）DOM(JAXP Crimson解析器)
DOM是用與平臺(tái)和語(yǔ)言無(wú)關(guān)的方式表示XML文檔的官方W3C標(biāo)準(zhǔn)。DOM是以層次結(jié)構(gòu)組織的節(jié)點(diǎn)或信息片斷的集合。這個(gè)層次結(jié)構(gòu)允許開(kāi)發(fā)人員在樹(shù)中尋找特定信息。分析該結(jié)構(gòu)通常需要加載整個(gè)文檔和構(gòu)造層次結(jié)構(gòu)，然后才能做任何工作。由于它是基于信息層次的，因而DOM被認(rèn)為是基于樹(shù)或基于對(duì)象的。DOM 以及廣義的基于樹(shù)的處理具有幾個(gè)優(yōu)點(diǎn)。首先，由于樹(shù)在內(nèi)存中是持久的，因此可以修改它以便應(yīng)用程序能對(duì)數(shù)據(jù)和結(jié)構(gòu)作出更改。它還可以在任何時(shí)候在樹(shù)中上下導(dǎo)航，而不是像SAX那樣是一次性的處理。DOM使用起來(lái)也要簡(jiǎn)單得多。

2）SAX

SAX處理的優(yōu)點(diǎn)非常類(lèi)似于流媒體的優(yōu)點(diǎn)。分析能夠立即開(kāi)始，而不是等待所有的數(shù)據(jù)被處理。而且，由于應(yīng)用程序只是在讀取數(shù)據(jù)時(shí)檢查數(shù)據(jù)，因此不需要將數(shù) 據(jù)存儲(chǔ)在內(nèi)存中。這對(duì)于大型文檔來(lái)說(shuō)是個(gè)巨大的優(yōu)點(diǎn)。事實(shí)上，應(yīng)用程序甚至不必解析整個(gè)文檔；它可以在某個(gè)條件得到滿(mǎn)足時(shí)停止解析。一般來(lái)說(shuō)，SAX還比它的替代者DOM快許多。
選擇DOM還是選擇SAX？對(duì)于需要自己編寫(xiě)代碼來(lái)處理XML文檔的開(kāi)發(fā)人員來(lái)說(shuō)，選擇DOM還是SAX解析模型是一個(gè)非常重要的設(shè)計(jì)決策。 DOM采用建立樹(shù)形結(jié)構(gòu)的方式訪問(wèn)XML文檔，而SAX采用的事件模型。

　　DOM解析器把XML文檔轉(zhuǎn)化為一個(gè)包含其內(nèi)容的樹(shù)，并可以對(duì)樹(shù)進(jìn)行遍歷。用DOM解析模型的優(yōu)點(diǎn)是編程容易，開(kāi)發(fā)人員只需要調(diào)用建樹(shù)的指令，然后利用navigation APIs訪問(wèn)所需的樹(shù)節(jié)點(diǎn)來(lái)完成任務(wù)。可以很容易的添加和修改樹(shù)中的元素。然而由于使用DOM解析器的時(shí)候需要處理整個(gè)XML文檔，所以對(duì)性能和內(nèi)存的要求比較高，尤其是遇到很大的XML文件的時(shí)候。由于它的遍歷能力，DOM解析器常用于XML文檔需要頻繁的改變的服務(wù)中。

　　SAX解析器采用了基于事件的模型，它在解析 XML文檔的時(shí)候可以觸發(fā)一系列的事件，當(dāng)發(fā)現(xiàn)給定的tag的時(shí)候，它可以激活一個(gè)回調(diào)方法，告訴該方法制定的標(biāo)簽已經(jīng)找到。SAX對(duì)內(nèi)存的要求通常會(huì)比較低，因?yàn)樗岄_(kāi)發(fā)人員自己來(lái)決定所要處理的tag。特別是當(dāng)開(kāi)發(fā)人員只需要處理文檔中所包含的部分?jǐn)?shù)據(jù)時(shí)，SAX這種擴(kuò)展能力得到了更好的體現(xiàn)。但用 SAX解析器的時(shí)候編碼工作會(huì)比較困難，而且很難同時(shí)訪問(wèn)同一個(gè)文檔中的多處不同數(shù)據(jù)。

3）JDOM http://www.jdom.org/

JDOM的目的是成為Java特定文檔模型，它簡(jiǎn)化與XML的交互并且比使用DOM實(shí)現(xiàn)更快。由于是第一個(gè)Java特定模型，JDOM一直得到大力推廣和促進(jìn)。正在考慮通過(guò)“Java規(guī)范請(qǐng)求JSR-102”將它最終用作“Java標(biāo)準(zhǔn)擴(kuò)展”。從2000年初就已經(jīng)開(kāi)始了JDOM開(kāi)發(fā)。

　　JDOM與DOM主要有兩方面不同。首先，JDOM僅使用具體類(lèi)而不使用接口。這在某些方面簡(jiǎn)化了API，但是也限制了靈活性。第二，API大量使用了Collections類(lèi)，簡(jiǎn)化了那些已經(jīng)熟悉這些類(lèi)的Java開(kāi)發(fā)者的使用。

　　JDOM文檔聲明其目的是“使用20%(或更少) 的精力解決80%(或更多)Java/XML問(wèn)題”(根據(jù)學(xué)習(xí)曲線假定為20%)。JDOM對(duì)于大多數(shù)Java/XML應(yīng)用程序來(lái)說(shuō)當(dāng)然是有用的，并且大多數(shù)開(kāi)發(fā)者發(fā)現(xiàn)API比DOM容易理解得多。JDOM還包括對(duì)程序行為的相當(dāng)廣泛檢查以防止用戶(hù)做任何在XML中無(wú)意義的事。然而，它仍需要您充分理解 XML以便做一些超出基本的工作(或者甚至理解某些情況下的錯(cuò)誤)。這也許是比學(xué)習(xí)DOM或JDOM接口都更有意義的工作。

　　JDOM自身不包含解析器。它通常使用SAX2解析器來(lái)解析和驗(yàn)證輸入XML文檔(盡管它還可以將以前構(gòu)造的DOM表示作為輸入)。它包含一些轉(zhuǎn)換器以將JDOM表示輸出成SAX2事件流、DOM模型或 XML文本文檔。JDOM是在Apache許可證變體下發(fā)布的開(kāi)放源碼。

4）DOM4J http://dom4j.sourceforge.net/

雖然DOM4J代表了完全獨(dú)立的開(kāi)發(fā)結(jié)果，但最初，它是JDOM的一種智能分支。它合并了許多超出基本XML文檔表示的功能，包括集成的XPath支持、 XML Schema支持以及用于大文檔或流化文檔的基于事件的處理。它還提供了構(gòu)建文檔表示的選項(xiàng)，它通過(guò)DOM4J API和標(biāo)準(zhǔn)DOM接口具有并行訪問(wèn)功能。從2000下半年開(kāi)始，它就一直處于開(kāi)發(fā)之中。

　　為支持所有這些功能，DOM4J使用接口和抽象基本類(lèi)方法。DOM4J大量使用了API中的Collections類(lèi)，但是在許多情況下，它還提供一些替代方法以允許更好的性能或更直接的編碼方法。直接好處是，雖然DOM4J付出了更復(fù)雜的API的代價(jià)，但是它提供了比JDOM大得多的靈活性。

　　在添加靈活性、XPath集成和對(duì)大文檔處理的目標(biāo)時(shí)，DOM4J的目標(biāo)與JDOM是一樣的：針對(duì)Java開(kāi)發(fā)者的易用性和直觀操作。它還致力于成為比JDOM更完整的解決方案，實(shí)現(xiàn)在本質(zhì)上處理所有 Java/XML問(wèn)題的目標(biāo)。在完成該目標(biāo)時(shí)，它比JDOM更少?gòu)?qiáng)調(diào)防止不正確的應(yīng)用程序行為。

　　DOM4J是一個(gè)非常非常優(yōu)秀的Java XML API，具有性能優(yōu)異、功能強(qiáng)大和極端易用使用的特點(diǎn)，同時(shí)它也是一個(gè)開(kāi)放源代碼的軟件。如今你可以看到越來(lái)越多的Java軟件都在使用DOM4J來(lái)讀寫(xiě) XML，特別值得一提的是連Sun的JAXM也在用DOM4J。

2.. 比較

1）DOM4J性能最好，連Sun的JAXM也在用DOM4J。目前許多開(kāi)源項(xiàng)目中大量采用DOM4J，例如大名鼎鼎的Hibernate也用DOM4J來(lái)讀取XML配置文件。如果不考慮可移植性，那就采用DOM4J.

2）JDOM和DOM在性能測(cè)試時(shí)表現(xiàn)不佳，在測(cè)試 10M文檔時(shí)內(nèi)存溢出。在小文檔情況下還值得考慮使用DOM和JDOM。雖然JDOM的開(kāi)發(fā)者已經(jīng)說(shuō)明他們期望在正式發(fā)行版前專(zhuān)注性能問(wèn)題，但是從性能觀點(diǎn)來(lái)看，它確實(shí)沒(méi)有值得推薦之處。另外，DOM仍是一個(gè)非常好的選擇。DOM實(shí)現(xiàn)廣泛應(yīng)用于多種編程語(yǔ)言。它還是許多其它與XML相關(guān)的標(biāo)準(zhǔn)的基礎(chǔ)，因?yàn)?它正式獲得W3C推薦(與基于非標(biāo)準(zhǔn)的Java模型相對(duì))，所以在某些類(lèi)型的項(xiàng)目中可能也需要它(如在JavaScript中使用DOM)。

3）SAX表現(xiàn)較好，這要依賴(lài)于它特定的解析方式－事件驅(qū)動(dòng)。一個(gè)SAX檢測(cè)即將到來(lái)的XML流，但并沒(méi)有載入到內(nèi)存(當(dāng)然當(dāng)XML流被讀入時(shí)，會(huì)有部分文檔暫時(shí)隱藏在內(nèi)存中)。

3. 四種xml操作方式的基本使用方法

xml文件：

<?xml version="1.0" encoding="utf-8" ?>
<Result>
   <VALUE>
       <NO DATE="2005">A1</NO>
       <ADDR>GZ</ADDR>
   </VALUE>
   <VALUE>
       <NO DATE="2004">A2</NO>
       <ADDR>XG</ADDR>
</VALUE>
</Result>

1）DOM

import java.io.*;
import java.util.*;
import org.w3c.dom.*;
import javax.xml.parsers.*;

public class MyXMLReader{
public static void main(String arge[]){

　　long lasting =System.currentTimeMillis();
try{
File f=new File("data_10k.xml");
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=factory.newDocumentBuilder();
Document doc = builder.parse(f);
NodeList nl = doc.getElementsByTagName("VALUE");
for (int i=0;i＜nl.getLength();i++){
System.out.print("車(chē)牌號(hào)碼:" + doc.getElementsByTagName("NO").item(i).getFirstChild().getNodeValue());
System.out.println("車(chē)主地址:" + doc.getElementsByTagName("ADDR").item(i).getFirstChild().getNodeValue());
}
}catch(Exception e){
e.printStackTrace();
}

2）SAX

import org.xml.sax.*;
import org.xml.sax.helpers.*;
import javax.xml.parsers.*;

public class MyXMLReader extends DefaultHandler {

　java.util.Stack tags = new java.util.Stack();
public MyXMLReader() {
super();
}

　public static void main(String args[]) {
long lasting = System.currentTimeMillis();
try {
SAXParserFactory sf = SAXParserFactory.newInstance();
SAXParser sp = sf.newSAXParser();
MyXMLReader reader = new MyXMLReader();
sp.parse(new InputSource("data_10k.xml"), reader);
} catch (Exception e) {
e.printStackTrace();
}

　　System.out.println("運(yùn)行時(shí)間：" + (System.currentTimeMillis() - lasting) + "毫秒");}
public void characters(char ch[], int start, int length) throws SAXException {
String tag = (String) tags.peek();
if (tag.equals("NO")) {
System.out.print("車(chē)牌號(hào)碼：" + new String(ch, start, length));
    }
    if (tag.equals("ADDR")) {
System.out.println("地址:" + new String(ch, start, length));
    }
   }

　　public void startElement(String uri,String localName,String qName,Attributes attrs) {
tags.push(qName);}
}

3） JDOM

import java.io.*;
import java.util.*;
import org.jdom.*;
import org.jdom.input.*;

public class MyXMLReader {

　public static void main(String arge[]) {
long lasting = System.currentTimeMillis();
try {
SAXBuilder builder = new SAXBuilder();
Document doc = builder.build(new File("data_10k.xml"));
Element foo = doc.getRootElement();
List allChildren = foo.getChildren();
for(int i=0;i＜allChildren.size();i++) {
System.out.print("車(chē)牌號(hào)碼:" + ((Element)allChildren.get(i)).getChild("NO").getText());
System.out.println("車(chē)主地址:" + ((Element)allChildren.get(i)).getChild("ADDR").getText());
}
} catch (Exception e) {
e.printStackTrace();
}

}

4）DOM4J

import java.io.*;
import java.util.*;
import org.dom4j.*;
import org.dom4j.io.*;

public class MyXMLReader {

　public static void main(String arge[]) {
long lasting = System.currentTimeMillis();
try {
File f = new File("data_10k.xml");
SAXReader reader = new SAXReader();
Document doc = reader.read(f);
Element root = doc.getRootElement();
Element foo;
for (Iterator i = root.elementIterator("VALUE"); i.hasNext();) {
foo = (Element) i.next();
System.out.print("車(chē)牌號(hào)碼:" + foo.elementText("NO"));
System.out.println("車(chē)主地址:" + foo.elementText("ADDR"));
}
} catch (Exception e) {
e.printStackTrace();
}

posted on 2009-08-17 09:46 大鳥(niǎo) 閱讀(233) 評(píng)論(0) 編輯收藏所屬分類(lèi): JAVA

新用戶(hù)注冊(cè) 刷新評(píng)論列表


只有注冊(cè)用戶(hù)登錄后才能發(fā)表評(píng)論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問(wèn) 管理
相關(guān)文章: （轉(zhuǎn)）關(guān)于Spring中ApplicationContext的說(shuō)明 JavaGUI應(yīng)用程序部署優(yōu)秀程序員的十個(gè)習(xí)慣 DOM 解析XML jboss 4.2.2 只能localhost訪問(wèn) 不能通過(guò)ip訪問(wèn)解決 ActiveMQ入門(mén)(轉(zhuǎn)) JBoss和JMS(寫(xiě)的不錯(cuò)，抄來(lái)看看) java concurrent 探秘（2） java concurrent 探秘（1） Java 線程池的原理與實(shí)現(xiàn)

常用鏈接

留言簿(1)

隨筆分類(lèi)

隨筆檔案

文章分類(lèi)

文章檔案

相冊(cè)

我的收藏

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜