JAXP是一U专门提供XML文档解析的Java接口Q下面我们就来研I一下如何用Apache Xerces-2 解析器来实现JAXP?/p>
JAXP提供了一UDOM及SAX方式的解析器来处理XML文Q也是工厂模式。你选择不同的工厂类׃有不同的处理Ҏ。工厂类实际上是一个标准设计模式,你可以根据需要自行修攏V?/p>
利用JAXPQ你可以使用DocumentBuilderFactory来徏立自qDocumentBuilderc,或者用SAXParserFactory来徏立自qSAXParsercR不同之处就在于DOM解析器是整个文读入内存ƈ允许你以随机方式d文档Q而SAX解析器是通过呼叫句柄来解释XML文数据的。下面我们仔l研I一下DocumentBuildercR?/p>
通过在DocumentBuilderFactorycM呼叫newDocumentBuilderҎQ我们可以徏立一个DocumentBuildercR你可以通过呼叫newInstanceҎ来徏立多个DocumentBuilderFactorycR?/p>
例如Q你可以q样建立一个新的DocumentBuilderFactoryc:
DocumentBuilderFactorydbfactory = DocumentBuilderFactory.newInstance();
一旦有了工厂类的句柄,你就可以马上建立一个DOM解析器的实例了。下面是建立代码Q?/p>
DocumentBuilder builder = dbfactory. newDocumentBuilder();
q样我们徏立了一个真正的DocumentBuildercȝ实例。ؓ了解析文,你必调用DocumentBuildercȝ解析Ҏ。解析方法会q回一个Document对象Q就是你要操作的XML文?/p>
Listing A实现了一个简单的利用DocumentBuilderFactory和DocumentBuildercȝҎQ?/p>
Listing A:
JAXPSample.java
import javax.xml.parsers.*;
import org.w3c.dom.*;
public class JAXPSample {
public static void main(String[] args) {
String filename = "sample.xml";
try {
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder parser = factory.newDocumentBuilder();
Document d = parser.parse(filename);
}
catch (Exception e) {
System.err.println("Exception: " + e.getMessage());
}
}
}
DocumentBuildercd实就是一个DOM解析器。利用JAXP的DocumentBuildercȝ优势在于它比其他XML解析器更M?/p>
当通过DocumentBuilder接口使用DOMӞ解析器会q回一个DocumentcR这个Documentcd重要Q因为它是完全符合W3C标准的,q意呌你可以将q个Documentcd其他DOM解析器良好的l合h?/p>
例如你可以通过以下代码扑֛元素|
String getXMLValue(Document doc, String name) {
NodeListnlist=doc.getElementsByTagName(name);
String value = nlist.item(0).getFirstChild().getNodeValue();
return value;
}
q个Ҏ用来L文内与字符串一致的子节炏V?br>
以Sun公司的JAXPZ来看看其中和DOM相关的包:
DOM包结?br>
org.w3c.comQ定义了DOM的接口。这是w3c所指制定的DOM规范Q因为DOM规范是与语言无关的,因而其中只是定义了接口Q而没有实CQ何地cRQ何具体的DOM实现需要有其它的类库给出?br>
javax.xml.parserQ定义了DocumentBuilderFactorycDocumentBuildercR编E时用DocumentBuilderFactory来生成一个具体的和具体的cd相联pȝDocumentBuildercȝ实例Q然后再p个DocumentBuilder对象来生成一个Document实例。Document对象中就包含了DOM的树模型l构Q是DOM模型的根。同SAXParserFactory一P具体的DocumentBuilder对象的徏立,取决于一个环境变量javax.xml.parsers.DocumentBuilderFactory的|同样的,也可以直接把cd传递给DocumentBuilderFactory来徏立一个DocumentBuilder?br>
com.sun.xml.treeQSun的Java XML的DOM实现Q他Ҏ准的DOM提供了一些扩展,其中大部分的东西q不是DOM标准。包括了XMLDocumentQElementNode, XMLDocumentBuilder和TreeWalker{类。XMLDocumentcdCDOM的Document界面Q它同样也提供了静态的工厂Ҏ来徏立一个Document对象。ElementNodecM表了在一个DOM树中的每一个节点元素,q且它经常被l承Q来实现一些自定的功能?而XMLDocumentBuilder实际上是一个DocumentHandlercd的类Q也是_它接受一个SAX解析器传递过来的事gQ然后根据这些事件来在内存中建立一个DOM模型?br>
DOM处理q程
DOM的处理过E相对SAX而言要简单些Q先用DocumentBuilderFactory的静态方法newInstance()建立一个DocumentBuilderFactory的实例,然后用它的newDocumentBuilder()Ҏ建立一个DocumentBuilder。然后可以用DocumentBuilder的parser()Ҏ来解析一个XML文q徏立DOM模型。在JAXP中还提供了更为方便的功能扩展Q就是用XMLDocument。你可以Z个SAX解析器注册一个事件处理器XMLDocumentBuilderQ在解析q后Q可以调用XMLDocumentBuilder的getDocument()Ҏ可以把一个外在地XML文转换成一个内存中的DOM树了Qƈ生成一个Document(XMLDocument)对象Q后面的工作Q就是调用XMLDocument对象和ElementNode对象的各个方法来对DOM树进行操作了。最后,q可以调用XMLDocument的wirte()Ҏ来把DOM树输ZؓXML文g。因为在标准的DOM模型中ƈ没有提供与write()相类似的ҎQ所以要处理输出的话Q用XMLDocument会更方便些?br>
实例DOM
下面我们可以来看看例子了?br>
首先当然是import语句Q?br>
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.FactoryConfigurationError;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.DocumentBuilder;
Z能给你更多的印象Q我详细内出了所有的c,实际上你只需要一句就可以了:
import javax.xml.parsers.*;
你还需要的是W3C对DOM和DOM例外的定义:
import org.w3c.dom.Document; import org.w3c.dom.DOMException;
q有一些其他的用来q行例外和I/O处理的类Q?br>
import org.xml.sax.SAXException;
import org.xml.sax.SAXParseException;
import java.io.File;
import java.io.IOException;
因ؓ要输出XML文Q所以还要引入XMLDocumentQ?br>
import com.sun.xml.tree.XmlDocument;
public class DomEcho{
在程序逻辑中,因ؓ要处理DOM模型Q所以当焉先应该申明一个Document对象Q?br>
static Document document;
public static void main (String argv [])
{
if (argv.length != 1) {
System.err.println ("Usage: java DomEcho filename");
System.exit (1);
}
用DocumentBuilderFactorycȝ静态方法newInstance()来创Z个工厂实例,之所以称为工厂,是由于再q儿应用C设计模式QDesign PatternQ中的工厂模式,实际上在Javacd中设计模式的范例随处可见Q如果能够对设计模式有一些了解,׃很容易ؓJava庞杂的类库理Z条条脉络分明的经Uѝ?
DocumentBuilderFactory factory =
DocumentBuilderFactory.newInstance();
try {
DocumentBuilder builder = factory.newDocumentBuilder();
document = builder.parse( new File(argv[0]) );
前面说过QDOM标准模型中ƈ没有定义输出的接口,因而如果需要进行文档输出的话,需要用到JAXP的扩展,使用到XmlDocument。这儿有一个较为简便的ҎQ就是用强制cd转换Q把一个Documentc{换成XmlDocumentQ然后,可以用XmlDocument的write()Ҏ?
XmlDocument xdoc = (XmlDocument) document;
xdoc.write (System.out);
在后面的都是例外的处理了Q在DOM中虽然有定义了DOMExceptionQ但是DOMException只是用在遍历和操作DOM树时引发的例外。在解析文和初始化解析器时所引发的例外,q是借助于SAX中的例外处理ҎQ以使程序上h一致性:
} catch (SAXParseException spe) {
// 处理解析q程中生成的例外
System.out.println ("\n** Parsing error"
+ ", line " + spe.getLineNumber ()
+ ", uri " + spe.getSystemId ());
System.out.println(" " + spe.getMessage() );
Exception x = spe;
if (spe.getException() != null)
x = spe.getException();
x.printStackTrace();
} catch (SAXException sxe) {
// 处理一般的E序例外或者解析器初始化时引发的例?br>
Exception x = sxe;
if (sxe.getException() != null)
x = sxe.getException();
x.printStackTrace();
} catch (IOException ioe) {
// IO例外
ioe.printStackTrace();
}
}
q而对DOM讲的比较略,但是基本的程序结构我们已l可以从中看出来了?