久久久久久久影视,日本久久综合,日韩成人综合网

四种操作xml的方式： SAX, DOM, JDOM , DOM4J的比较[转蝲]

Eric.Zhou — Sat, 20 Jun 2009 06:09:00 GMT

原文地址:http://blog.chinaunix.net/u/25176/showart_379827.html

1. 介绍

1�Q�DOM(JAXP Crimson解析�?
DOM是用与��^台和语言无关的方式表�C�XML文档的官方W3C标准。DOM是以层次�l�构�l�织的节�Ҏ��信息片断的集合。这个层�ơ结构允许开发�h员在树中��L��特定信息。分析该�l�构通常需要加载整个文档和构造层�ơ结构，然后才能做�Q何工作。由于它是基于信息层�ơ的�Q�因而DOM被认为是��Z��树或��Z��对象的。DOM以及�q�义的基于树的处理具有几个优炏V��首先，�׃��树在内存中是持久的，因此可以修改它以便应用程序能�Ҏ��据和�l�构作出更改。它�q�可以在��M��时候在树中上下��D��Q�而不是像SAX那样是一�ơ性的处理。DOM使用��h��也要��单得多�?/p>

2�Q�SAX

SAX处理的优炚w��常类��g��媒体的优点。分析能够立卛_��始，而不是等待所有的数据被处理。而且�Q�由于应用程序只是在��d��数据时检查数据，因此不需要将数据存储在内存中。这对于大型文档来说是个巨大的优炏V��事实上�Q�应用程序甚至不必解析整个文档；它可以在某个条�g得到满��时停止解析。一般来��_��SAX�q�比它的替代者DOM快许多�?
　　选择DOM�q�是选择SAX�Q?对于需要自��q��写代码来处理XML文档的开发�h员来��_�� 选择DOM�q�是SAX解析模型是一个非帔R��要的设计决策�?DOM采用建立树�Ş�l�构的方式访问XML文档�Q�而SAX采用的事件模型�?

　　DOM解析器把XML文档转化��Z��个包含其内容的树�Q��ƈ可以�Ҏ��q�行遍历。用DOM解析模型的优�Ҏ��~�程�Ҏ��Q�开发�h员只需要调用徏树的指��o�Q�然后利用navigation APIs讉K��所需的树节点来完成�Q务。可以很�Ҏ��的添加和修改树中的元素。然而由于��用DOM解析器的时候需要处理整个XML文档�Q�所以对性能和内存的要求比较高，��其是遇到很大的XML文�g的时候。由于它的遍历能力，DOM解析器常用于XML文档需要频�J�的改变的服务中�?

　　SAX解析器采用了��Z��事�g的模型，它在解析XML文档的时候可以触发一�p�d��的事�Ӟ��当发现给定的tag的时候，它可以激�z�M��个回调方法，告诉该方法制定的标签已经扑ֈ�。SAX对内存的要求通常会比较低�Q�因为它让开发�h员自己来军_��所要处理的tag。特别是当开发�h员只需要处理文档中所包含的部分数据时�Q�SAX�q�种扩展能力得到了更好的体现。但用SAX解析器的时候编码工作会比较困难�Q�而且很难同时讉K��同一个文档中的多处不同数据�?

3�Q�JDOM http://www.jdom.org/

JDOM的目的是成�ؓJava特定文档模型�Q�它��化与XML的交互�ƈ且比使用DOM实现更快。由于是�W�一个Java特定模型�Q�JDOM一直得到大力推�q�和促进。正在考虑通过“Java规范��h��JSR-102”��它最�l�用�?#8220;Java标准扩展”。从2000�q�初��已�l�开始了JDOM开发�?

　　JDOM与DOM主要有两斚w��不同。首先，JDOM仅��用具体类而不使用接口。这在某些方面简化了API�Q�但是也限制了灵�z�L��。第二，API大量使用了Collections�c�，��化了那些已经熟悉�q�些�cȝ��Java开发者的使用�?

　　JDOM文档声明其目的是“使用20%(或更��?的精力解�?0%(或更�?Java/XML问题”(�Ҏ��学习曲线假定�?0%)。JDOM对于大多数Java/XML应用�E�序来说当然是有用的�Q��ƈ且大多数开发者发现API比DOM�Ҏ��理解得多。JDOM�q�包括对�E�序行�ؓ的相当广泛检查以防止用户做�Q何在XML中无意义的事。然而，它仍需要您充分理解XML以便做一些超出基本的工作(或者甚至理解某些情况下的错�?。这也许是比学习DOM或JDOM接口都更有意义的工作�?

　　JDOM自��n不包含解析器。它通常使用SAX2解析器来解析和验证输入XML文档(��管它还可以��以前构造的DOM表示作�ؓ输入)。它包含一些�{换器以将JDOM表示输出成SAX2事�g��、DOM模型或XML文本文档。JDOM是在Apache许可证变体下发布的开放源码�?/p>

4�Q�DOM4J http://dom4j.sourceforge.net/

虽然DOM4J代表了完全独立的开发结果，但最初，它是JDOM的一�U�智能分支。它合�ƈ了许多超出基本XML文档表示的功能，包括集成的XPath支持、XML Schema支持以及用于大文档或��化文档的基于事件的处理。它�q�提供了构徏文档表示的选项�Q�它通过DOM4J API和标准DOM接口��h��q�行讉K��功能。从2000下半�q�开始，它就一直处于开发之中�?

　　为支持所有这些功能，DOM4J使用接口和抽象基本类�Ҏ��。DOM4J大量使用了API中的Collections�c�，但是在许多情况下�Q�它�q�提供一些替代方法以允许更好的性能或更直接的编码方法。直接好处是�Q�虽然DOM4J付出了更复杂的API的代��P��但是它提供了比JDOM大得多的灉|��性�?

　　在添加灵�z�L��、XPath集成和对大文档处理的目标�Ӟ��DOM4J的目标与JDOM是一��L��Q�针对Java开发者的易用性和直观操作。它�q�致力于成�ؓ比JDOM更完整的解决�Ҏ��Q�实现在本质上处理所有Java/XML问题的目标。在完成该目标时�Q�它比JDOM更少��防止不正��的应用�E�序行�ؓ�?

　　DOM4J是一个非帔R��怼��U�的Java XML API�Q�具有性能优异、功能强大和极端易用使用的特点，同时它也是一个开放源代码的��Y件。如今你可以看到��来��多的Java软�g都在使用DOM4J来读写XML�Q�特别值得一提的是连Sun的JAXM也在用DOM4J�?

2.. 比较

1�Q�DOM4J性能最好，�q�Sun的JAXM也在用DOM4J。目前许多开源项目中大量采用DOM4J�Q�例如大名鼎鼎的Hibernate也用DOM4J来读取XML配置文�g。如果不考虑可移植性，那就采用DOM4J.

2�Q�JDOM和DOM在性能��试时表��C��佻I��在测�?0M文档时内存溢出。在��文档情况下�q�值得考虑使用DOM和JDOM。虽然JDOM的开发者已�l�说明他们期望在正式发行版前专注性能问题�Q�但是从性能观点来看�Q�它��实没有值得推荐之处。另外，DOM仍是一个非常好的选择。DOM实现�q�泛应用于多�U�编�E�语�a�。它�q�是许多其它与XML相关的标准的基础�Q�因为它正式获得W3C推荐(与基于非标准的Java模型相对)�Q�所以在某些�c�d��的项目中可能也需要它(如在JavaScript中��用DOM)�?/p>

3�Q�SAX表现较好�Q�这要依赖于它特定的解析方式�Q�事仉��动。一个SAX��即��到来的XML��，但�ƈ没有载入到内�?当然当XML��被��d��Ӟ��会有部分文档暂时隐藏在内存中)�?/p>

3. 四种xml操作方式的基本��用方�?/p>

xml文�g�Q?/p>

       A1
       GZ


       A2
       XG

1�Q�DOM

import Java.io.*;
import Java.util.*;
import org.w3c.dom.*;
import javax.xml.parsers.*;

public class MyXMLReader{
　public static void main(String arge[]){

　　long lasting =System.currentTimeMillis();
　　try{
　　　File f=new File("data_10k.xml");
　　　DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
　　　DocumentBuilder builder=factory.newDocumentBuilder();
　　　Document doc = builder.parse(f);
　　　NodeList nl = doc.getElementsByTagName("VALUE");
　　　for (int i=0;i�Q�nl.getLength();i++){
　　　　System.out.print("车牌��L��:" + doc.getElementsByTagName("NO").item(i).getFirstChild().getNodeValue());
　　　　System.out.println("车主地址:" + doc.getElementsByTagName("ADDR").item(i).getFirstChild().getNodeValue());
　　}
　　}catch(Exception e){
　　　e.printStackTrace();
}

2�Q�SAX

import org.xml.sax.*;
import org.xml.sax.helpers.*;
import javax.xml.parsers.*;

public class MyXMLReader extends DefaultHandler {

　Java.util.Stack tags = new Java.util.Stack();
　public MyXMLReader() {
　　super();
}

　public static void main(String args[]) {
　　long lasting = System.currentTimeMillis();
　　try {
　　　SAXParserFactory sf = SAXParserFactory.newInstance();
　　　SAXParser sp = sf.newSAXParser();
　　　MyXMLReader reader = new MyXMLReader();
　　　sp.parse(new InputSource("data_10k.xml"), reader);
　　} catch (Exception e) {
　　　e.printStackTrace();
　　}

　　System.out.println("�q�行旉��Q? + (System.currentTimeMillis() - lasting) + "毫秒");}
　　public void characters(char ch[], int start, int length) throws SAXException {
　　String tag = (String) tags.peek();
　　if (tag.equals("NO")) {
　　　System.out.print("车牌��L��Q? + new String(ch, start, length));
    }
    if (tag.equals("ADDR")) {
　　System.out.println("地址:" + new String(ch, start, length));
    }
   }

　　public void startElement(String uri,String localName,String qName,Attributes attrs) {
　　tags.push(qName);}
}

3�Q?JDOM

import Java.io.*;
import Java.util.*;
import org.jdom.*;
import org.jdom.input.*;

public class MyXMLReader {

　public static void main(String arge[]) {
　　long lasting = System.currentTimeMillis();
　　try {
　　　SAXBuilder builder = new SAXBuilder();
　　　Document doc = builder.build(new File("data_10k.xml"));
　　　Element foo = doc.getRootElement();
　　　List allChildren = foo.getChildren();
　　　for(int i=0;i�Q�allChildren.size();i++) {
　　　　System.out.print("车牌��L��:" + ((Element)allChildren.get(i)).getChild("NO").getText());
　　　　System.out.println("车主地址:" + ((Element)allChildren.get(i)).getChild("ADDR").getText());
　　　}
　　} catch (Exception e) {
　　　e.printStackTrace();
}

}

4�Q�DOM4J

import Java.io.*;
import Java.util.*;
import org.dom4j.*;
import org.dom4j.io.*;

public class MyXMLReader {

　public static void main(String arge[]) {
　　long lasting = System.currentTimeMillis();
　　try {
　　　File f = new File("data_10k.xml");
　　　SAXReader reader = new SAXReader();
　　　Document doc = reader.read(f);
　　　Element root = doc.getRootElement();
　　　Element foo;
　　　for (Iterator i = root.elementIterator("VALUE"); i.hasNext();) {
　　　　foo = (Element) i.next();
　　　　System.out.print("车牌��L��:" + foo.elementText("NO"));
　　　　System.out.println("车主地址:" + foo.elementText("ADDR"));
　　　}
　　} catch (Exception e) {
　　　e.printStackTrace();
}
}

Eric.Zhou 2009-06-20 14:09 发表评论

RSS

Eric.Zhou — Fri, 18 Jan 2008 14:14:00 GMT

摘要: 1�Q�RSS 介绍 RSS是利用XML把一个网站的内容发送给其他�|�站的方式。RSS允许快速浏览新��M��更新�?什么是RSS�Q?RSS是在�U�共享内容的一�U�简易方式（也叫聚合内容�Q�Really Simple Syndication�Q�，Rss允许联合站点内容�Q�Rss定义了一个简单的方式来共享和查看标题及内宏V��Rss文�g可以自动更新�Q�Rss允许个�h查看不同站点�Q�Rss是用XML�~�写的�?��Z��么要使用R... 阅读全文

Eric.Zhou 2008-01-18 22:14 发表评论

XML/XSL-FO

Eric.Zhou — Fri, 18 Jan 2008 06:36:00 GMT

摘要: 在学习XSL-FO之前�Q�你应该已经掌握了XML和XML命名�I�间的基本知识�?1�Q�什么是XSL-FO�Q?XSL-FO 是用于将�l�果格式化成XML数据的语�a��Q�XSL-FO全称为（Extensible Stylesheet Language Formatting Objects�Q�扩展格式化对象样式表语�a��Q�，XSL-FO 是W3C的推荐标准，XSL-FO 现在通常被称为XSL�?XSL-FO 是用�?.. 阅读全文

Eric.Zhou 2008-01-18 14:36 发表评论

Java 语言�?XPath API

Eric.Zhou — Mon, 18 Sep 2006 05:34:00 GMT

XPath 表达式比�J�琐的文档对象模型（DOM�Q�导航代码要�Ҏ��~�写得多。如果需要从 XML 文档中提取信息，最快捷、最��单的办法��是�?Java™ �E�序中嵌�?XPath 表达式。Java 5 推出�?javax.xml.xpath 包，�q�是一个用�?XPath 文档查询的独立于 XML 对象模型的库�?/blockquote>
如果要告诉别��Z��一加仑牛奶�Q�您会怎么��_��“请去��C��加仑牛奶回来” �q�是 “从前门出去，向左转，��C��个街区向双��{�Q�再走半个街区向双��{�q�入商店。走向四号通道�Q�沿通道��C��c�_��左，拿一瓶一加仑装的牛奶然后到收银台付款。再沿原路回家�?#8221; ��直太可笑了。只要在 “请去��C��加仑牛奶回来” 的基��上稍加指�C�，多数成�h都能自己买回牛奶来�?

查询语言和计��机搜烦与此�c�M��。直接说 “找一�?Cryptonomicon 的副�?#8221; 要比�~�写搜烦某个数据库的详细逻辑�Ҏ��得多。由于搜索操作的逻辑非常�怼��Q�可以发明一�U�通用语言让您使用 “扑ֈ� Neal Stephenson 的所有著�?#8221; �q�样的命令，然后�~�写对特定数据存储执行此�c�L��询的引擎�?

XPath

在众多查询语�a�之中�Q�结构化查询语言�Q�SQL�Q�是一�U�针�Ҏ��询特定类型的关系库而设计和优化的语�a�。其他不那么常见的查询语�a��q�有对象查询语言�Q�OQL�Q�和 XQuery。但本文的主题是 XPath�Q�一�U��ؓ查询 XML 文档而设计的查询语言。比如，下面�q�个��单的 XPath 查询可以在文档中扑ֈ�作者�ؓ Neal Stephenson 的所有图书的标题�Q?/p>
//book[author="Neal Stephenson"]/title
作�ؓ对照�Q�查询同样信息的�U?DOM 搜烦代码�?清单 1 所�C�：

清单 1. 扑ֈ� Neal Stephenson 所有著�?title 元素�?DOM 代码
ArrayList result = new ArrayList(); NodeList books = doc.getElementsByTagName("book"); for (int i = 0; i < books.getLength(); i++) { Element book = (Element) books.item(i); NodeList authors = book.getElementsByTagName("author"); boolean stephenson = false; for (int j = 0; j < authors.getLength(); j++) { Element author = (Element) authors.item(j); NodeList children = author.getChildNodes(); StringBuffer sb = new StringBuffer(); for (int k = 0; k < children.getLength(); k++) { Node child = children.item(k); // really should to do this recursively if (child.getNodeType() == Node.TEXT_NODE) { sb.append(child.getNodeValue()); } } if (sb.toString().equals("Neal Stephenson")) { stephenson = true; break; } } if (stephenson) { NodeList titles = book.getElementsByTagName("title"); for (int j = 0; j < titles.getLength(); j++) { result.add(titles.item(j)); } } }
不论您是否相信，清单 1 中的 DOM 昄��不如��单的 XPath 表达式通用或者健壮。您愿意�~�写、调试和�l�护哪一个？我想�{�案很明显�?

但是虽然有很强的表达能力�Q�XPath �q�不�?Java 语言�Q�事实上 XPath 不是一�U�完整的�~�程语言。有很多东西�?XPath 表达不出来，甚至有些查询也无法表达。比方说�Q�XPath 不能查找国际标准图书�~�码�Q�ISBN�Q�检验码不匹配的所有图书，或者找出境外帐��h��据库昄��Ơ帐的所有作者。幸�q�的是，可以�?XPath �l�合�?Java �E�序中，�q�样��p��发挥两者的优势了：Java �?Java 所擅长的，XPath �?XPath 所擅长的�?

直到最�q�，Java �E�序执行 XPath 查询所需要的应用�E�序�~�程接口�Q�API�Q�还因�Ş形色色的 XPath 引擎而各不相同。Xalan 有一�U?API�Q�Saxon 使用另一�U�，其他引擎则��用其他的 API。这意味着代码往往把您限制��C��U��品上。理��x��况下�Q�最好能够试验具有不同性能特点的各�U�引擎，而不会带来不适当的麻烦或者重新编写代码�?

于是�Q�Java 5 推出�?javax.xml.xpath 包，提供一个引擎和对象模型独立�?XPath 库。这个包也可用于 Java 1.3 及以后的版本�Q�但需要单独安�?Java API for XML Processing (JAXP) 1.3。Xalan 2.7 �?Saxon 8 以及其他产品包含了这个库的实现�?

回页�?/font>

一个简单的例子

我将举例说明如何使用它。然后再讨论一些细节问题。假设要查询一个图书列表，��L�� Neal Stephenson 的著作。具体来��_��q�个图书列表的�Ş式如清单 2 所�C�：

清单 2. 包含图书信息�?XML 文档
Snow Crash Neal Stephenson Spectra 0553380958 14.95 Burning Tower Larry Niven Jerry Pournelle Pocket 0743416910 5.99 Zodiac Neal Stephenson Spectra 0553573862 7.50
抽象工厂

XPathFactory 是一个抽象工厂。抽象工厂设计模式��得这一�U?API 能够支持不同的对象模型，�?DOM、JDOM �?XOM。�ؓ了选择不同的模型，需要向 XPathFactory.newInstance() �Ҏ��传递标识对象模型的�l�一资源标识�W�（URI�Q�。比�?http://xom.nu/ 可以选择 XOM。但实际上，到目前�ؓ�?DOM 是该 API 支持的惟一对象模型�?

查找所有图书的 XPath 查询非常��单：//book[author="Neal Stephenson"]。�ؓ了找��些图书的标题�Q�只要增加一步，表达式就变成�?//book[author="Neal Stephenson"]/title。最后，真正需要的�?title 元素的文本节点孩子。这��p��求再增加一步，完整的表辑ּ��是 //book[author="Neal Stephenson"]/title/text()�?

现在我提供一个简单的�E�序�Q�它�?Java 语言中执行这个查询，然后把找到的所有图书的标题打印出来。首先，需要将文档加蝲��C��?DOM Document 对象中。�ؓ了简化�v见，假设该文档在当前工作目录�?books.xml 文�g中。下面的��单代码片�D�解析文档�ƈ建立对应�?Document 对象�Q?

清单 3. �?JAXP 解析文档
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); factory.setNamespaceAware(true); // never forget this! DocumentBuilder builder = factory.newDocumentBuilder(); Document doc = builder.parse("books.xml");
到目前�ؓ止，�q�仅仅是标准�?JAXP �?DOM�Q�没有什么新鲜的�?

接下来创�?XPathFactory�Q?/p>
XPathFactory factory = XPathFactory.newInstance();
然后使用�q�个工厂创徏 XPath 对象�Q?
XPath xpath = factory.newXPath();
XPath 对象�~�译 XPath 表达式：
PathExpression expr = xpath.compile("http://book[author='Neal Stephenson']/title/text()");
直接求�?/b>

如果 XPath 表达式只使用一�ơ，可以跌��~�译步骤直接�?XPath 对象调用 evaluate() �Ҏ��。但是，如果同一个表辑ּ�要重复��用多�ơ，�~�译可能更快一些�?

最后，计算 XPath 表达式得到结果。表辑ּ�是针对特定的上下文节点计��的�Q�在�q�个例子中是整个文档。还必须指定�q�回�c�d��。这里要求返回一个节炚w��Q?
Object result = expr.evaluate(doc, XPathConstants.NODESET);
可以��结果强制�{化成 DOM NodeList�Q�然后遍历列表得到所有的标题�Q?
NodeList nodes = (NodeList) result; for (int i = 0; i < nodes.getLength(); i++) { System.out.println(nodes.item(i).getNodeValue()); }
清单 4 把上�q�片�D늻�合到了一个程序中。还要注意，�q�些�Ҏ��可能抛出一些检查异常，�q�些异常必须�?throws 子句中声明，但是我在上面把它们掩盖�v来了�Q?

清单 4. 用固定的 XPath 表达式查�?XML 文档的完整程�?/b>

import Java.io.IOException; import org.w3c.dom.*; import org.xml.sax.SAXException; import javax.xml.parsers.*; import javax.xml.xpath.*; public class XPathExample { public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException, XPathExpressionException { DocumentBuilderFactory domFactory = DocumentBuilderFactory.newInstance(); domFactory.setNamespaceAware(true); // never forget this! DocumentBuilder builder = domFactory.newDocumentBuilder(); Document doc = builder.parse("books.xml"); XPathFactory factory = XPathFactory.newInstance(); XPath xpath = factory.newXPath(); XPathExpression expr = xpath.compile("http://book[author='Neal Stephenson']/title/text()"); Object result = expr.evaluate(doc, XPathConstants.NODESET); NodeList nodes = (NodeList) result; for (int i = 0; i < nodes.getLength(); i++) { System.out.println(nodes.item(i).getNodeValue()); } } }

XPath 数据模型

每当混合使用诸如 XPath �?Java �q�样两种不同的语�a��Ӟ��必定会有某些��两者粘合在一��L��明显接缝。�ƈ非一切都很合拍。XPath �?Java 语言没有同样的类型系�l�。XPath 1.0 只有四种基本数据�c�d��Q?/p>

node-set

number

boolean

string

当然�Q�Java 语言有更多的数据�c�d��Q�包括用户定义的对象�c�d��?/p>
多数 XPath 表达式，特别是位�|��\径，都返回节炚w��。但是还有其他可能。比如，XPath 表达�?count(//book) �q�回文档中的图书数量。XPath 表达�?count(//book[@author="Neal Stephenson"]) > 10 �q�回一个布��|��如果文档�?Neal Stephenson 的著作超�q?10 本则�q�回 true�Q�否则返�?false�?

evaluate() �Ҏ��被声明�ؓ�q�回 Object。实际返回什么依赖于 XPath 表达式的�l�果以及要求的类型。一般来��_��XPath �?/p>

number 映射�?Java.lang.Double

string 映射�?Java.lang.String

boolean 映射�?Java.lang.Boolean

node-set 映射�?org.w3c.dom.NodeList

XPath 2

前面一直假设您使用的是 XPath 1.0。XPath 2 大大扩展和修改了�c�d��pȝ��。Java XPath API 支持 XPath 2 所需的主要修�Ҏ��?XPath 2 新数据类型增加常量�?

�?Java 中计��?XPath 表达式时�Q�第二个参数指定需要的�q�回�c�d��。有五种可能�Q�都�?javax.xml.xpath.XPathConstants �c�M��命名了常量：

XPathConstants.NODESET

XPathConstants.BOOLEAN

XPathConstants.NUMBER

XPathConstants.STRING

XPathConstants.NODE

最后一�?XPathConstants.NODE 实际上没有匹配的 XPath �c�d��。只有知�?XPath 表达式只�q�回一个节�Ҏ��者只需要一个节�Ҏ��才��用它。如�?XPath 表达式返回了多个节点�q�且指定�?XPathConstants.NODE�Q�则 evaluate() 按照文档��序�q�回�W�一个节炏V��如�?XPath 表达式选择了一个空集�ƈ指定�?XPathConstants.NODE�Q�则 evaluate() �q�回 null�?

如果不能完成要求的�{换，evaluate() ��抛�?XPathException�?

名称�I�间上下�?/font>

�?XML 文档中的元素在名�U�空间中�Q�查询该文档�?XPath 表达式必��M��用相同的名称�I�间。XPath 表达式不一定要使用相同的前�~��Q�只需要名�U�空�?URI 相同卛_��。事实上�Q�如�?XML 文档使用默认名称�I�间�Q�那么尽��目标文档没有��用前�~��Q�XPath 表达式也必须使用前缀�?

但是�Q�Java �E�序不是 XML 文档�Q�因此不能用一般的名称�I�间解析。必��L��供一个对象将前缀映射到名�U�空�?URI。该对象�?javax.xml.namespace.NamespaceContext 接口的实例。比如，假设图书文档攑֜� http://www.example.com/books 名称�I�间中，�?清单 5 所�C�：

清单 5. 使用默认名称�I�间�?XML 文档

Snow Crash Neal Stephenson Spectra 0553380958 14.95

查找 Neal Stephenson 全部著作标题�?XPath 表达式就要改�?//pre:book[pre:author="Neal Stephenson"]/pre:title/text()。但是，必须��前�~� pre 映射�?URI http://www.example.com/books�?code>NamespaceContext 接口�?Java 软�g开发工��L��Q�JDK�Q�或 JAXP 中没有默认实��C��乎有点笨�Q�但��实如此。不�q�，自己实现也不难�?a >清单 6 对一个名�U�空间给��Z��单的实现。还需要映��?xml 前缀�?

清单 6. �l�定一个名�U�空间和默认名称�I�间的简单上下文

import Java.util.Iterator; import javax.xml.*; import javax.xml.namespace.NamespaceContext; public class PersonalNamespaceContext implements NamespaceContext { public String getNamespaceURI(String prefix) { if (prefix == null) throw new NullPointerException("Null prefix"); else if ("pre".equals(prefix)) return "http://www.example.org/books"; else if ("xml".equals(prefix)) return XMLConstants.XML_NS_URI; return XMLConstants.NULL_NS_URI; } // This method isn't necessary for XPath processing. public String getPrefix(String uri) { throw new UnsupportedOperationException(); } // This method isn't necessary for XPath processing either. public Iterator getPrefixes(String uri) { throw new UnsupportedOperationException(); } }

使用映射存储�l�定和增�?setter �Ҏ��实现名称�I�间上下文的重用也不难�?

创徏 NamespaceContext 对象后，在编译表辑ּ�之前��其安装�?XPath 对象上。以后就可以像以前一��h��用这些前�~�查询了。比如：

清单 7. 使用名称�I�间�?XPath 查询

XPathFactory factory = XPathFactory.newInstance(); XPath xpath = factory.newXPath(); xpath.setNamespaceContext(new PersonalNamespaceContext()); XPathExpression expr = xpath.compile("http://pre:book[pre:author='Neal Stephenson']/pre:title/text()"); Object result = expr.evaluate(doc, XPathConstants.NODESET); NodeList nodes = (NodeList) result; for (int i = 0; i < nodes.getLength(); i++) { System.out.println(nodes.item(i).getNodeValue()); }

函数求解�?/font>

有时候，�?Java 语言中定义用�?XPath 表达式的扩展函数很有用。这些函数可以执行用�U?XPath 很难或者无法执行的��d��。不�q�必��L��真正的函敎ͼ�而不是随意的�Ҏ��。就是说不能有副作用。（XPath 函数可以按照��L��的顺序求��g�Q意多�ơ。）

通过 Java XPath API 讉K��的扩展函数必��d��?javax.xml.xpath.XPathFunction 接口。这个接口只声明了一个方�?evaluate�Q?

public Object evaluate(List args) throws XPathFunctionException

该方法必��返�?Java 语言能够转换�?XPath 的五�U�类型之一�Q?

String

Double

Boolean

Nodelist

Node

比如�Q?a >清单 8 昄��了一个扩展函敎ͼ�它检�?ISBN 的校验和�q�返�?Boolean。这个校验和的基本规则是前九位数的每一位乘上它的位�|�（即第一位数乘上 1�Q�第二位��C��?2�Q�依�ơ类推）。将�q�些数加��h��然后取除�?11 的余数。如果余数是 10�Q�那么最后一位数��是 X�?

清单 8. ��?ISBN �?XPath 扩展函数

import Java.util.List; import javax.xml.xpath.*; import org.w3c.dom.*; public class ISBNValidator implements XPathFunction { // This class could easily be implemented as a Singleton. public Object evaluate(List args) throws XPathFunctionException { if (args.size() != 1) { throw new XPathFunctionException("Wrong number of arguments to valid-isbn()"); } String isbn; Object o = args.get(0); // perform conversions if (o instanceof String) isbn = (String) args.get(0); else if (o instanceof Boolean) isbn = o.toString(); else if (o instanceof Double) isbn = o.toString(); else if (o instanceof NodeList) { NodeList list = (NodeList) o; Node node = list.item(0); // getTextContent is available in Java 5 and DOM 3. // In Java 1.4 and DOM 2, you'd need to recursively // accumulate the content. isbn= node.getTextContent(); } else { throw new XPathFunctionException("Could not convert argument type"); } char[] data = isbn.toCharArray(); if (data.length != 10) return Boolean.FALSE; int checksum = 0; for (int i = 0; i < 9; i++) { checksum += (i+1) * (data[i]-'0'); } int checkdigit = checksum % 11; if (checkdigit + '0' == data[9] || (data[9] == 'X' && checkdigit == 10)) { return Boolean.TRUE; } return Boolean.FALSE; } }

下一步让�q�个扩展函数能够�?Java �E�序中��用。�ؓ此，需要在�~�译表达式之前向 XPath 对象安装 javax.xml.xpath.XPathFunctionResolver。函数求解器��函数的 XPath 名称和名�U�空�?URI 映射到实现该函数�?Java �c�R�?a >清单 9 是一个简单的函数求解器，��扩展函�?valid-isbn 和名�U�空�?http://www.example.org/books 映射�?清单 8 中的�c�R��比如，XPath 表达�?//book[not(pre:valid-isbn(isbn))] 可以扑ֈ� ISBN 校验和不匚w��的所有图书�?

清单 9. 识别 valid-isbn 扩展函数的上下文

iimport javax.xml.namespace.QName; import javax.xml.xpath.*; public class ISBNFunctionContext implements XPathFunctionResolver { private static final QName name = new QName("http://www.example.org/books", "valid-isbn"); public XPathFunction resolveFunction(QName name, int arity) { if (name.equals(ISBNFunctionContext.name) && arity == 1) { return new ISBNValidator(); } return null; } }

�׃��扩展函数必须有名�U�空��_��所以计��包含扩展函数的表达式时必须使用 NamespaceResolver�Q�即便查询的文档没有使用��M��名称�I�间。由�?XPathFunctionResolver�?code>XPathFunction �?NamespaceResolver 都是接口�Q�如果方便的话可以将它们攑֜�所有的�c�M��?

�l�束�?/font>

�?SQL �?XPath �q�样的声明性语�a��~�写查询�Q�要比��?Java �?C �q�样的命令式语言�Ҏ��得多。但是，�?Java �?C �q�样的图灵完整语�a��~�写复杂的逻辑�Q�又�?SQL �?XPath �q�样的声明性语�a��Ҏ��得多。所�q�的是，通过使用 Java Database Connectivity (JDBC) �?javax.xml.xpath 之类�?API 可以��两者结合�v来。随着世界上越来越多的数据转向 XML�Q?code>javax.xml.xpath ��与 Java.sql 一样变得越来越重要�?/p>

Eric.Zhou 2006-09-18 13:34 发表评论

Eric.Zhou — Mon, 18 Sep 2006 01:18:00 GMT
摘要: 当前位置当我们��用XSLT处理XML源文档是�Q�我们用Context来表�C�当前正在被模板处理的节点位�|�。比如xsl:template match="/"语句中表�C�Context在文档的�?root)节点。我不知道如何准��的��译Context�q�个词，它类��g��C语言里的指针�Q�表�C�程序当前运行的位置。理解Context对于正确处理XSL模板非常重要�Q�当您的XSL模板输出的文档和您想要的不一��P��最�?.. 阅读全文

Eric.Zhou 2006-09-18 09:18 发表评论

xsl�q�程解析

Eric.Zhou — Mon, 18 Sep 2006 01:14:00 GMT

�q�是标准的XML文档的首行代码，因�ؓXSLT本��n也是XML文档�?br />encoding属性用来定义文档��用的�~�码形式�Q�iso-8859-1主要支持西欧和北��的语言�~�码�?br />如果你想使用��体中文，那么��应该写成：

接下�ȝ��代码�?

�q�是标准的XSLT文�g首行代码。xsl:stylesheet代码的意思是��文档作��Z��个样式表�?stylesheet)处理�?br />xmlns:xsl属性是一个名字空间声明，和XML中的名字�I�间使用�Ҏ��一��P��用来防止元素名称重复和�؜乱�?br />其中前缀xsl的意思是文档中��用的元素遵守W3C的XSLT规范�?br />最后的version属性说明样式表只采用XSLT 1.0的标准功能，�q�也是目前仅有的标准�?/p>

一�?lt;xsl:template>元素定义一个模板规则。属性match="/"说明XML源文档中�Q�这个模板规则作用的��L��?/"是一�U�XPath语法�Q�我们在后面��详�l�讲�q�ͼ��q�里�?/"代表XML�l�构树的�?root)�?/p>
接下�ȝ��代码�?

First XSLT Example

说明�Q�当模板规则被触发，模板的内容就会控制输出的�l�果。例子中�Q�模板大部分内容由HTML�?br />素和文本构成。只�?lt;xsl:value-of>元素是XSLT语法�Q�这�?lt;xsl:value-of>的作用是拯��原文档中�?br />一个节点的值到输出文档。而select属性则详细指定要处理的节点名称。这是XPath语法�Q?greeting"
的意思就是寻找根节点名�ؓgreeting的元素，�q�用模板来处理这个节炏V��具体的��是扑ֈ�
元素�Q�然后将元素的�?hello world"按模板样式拷贝到输出文�g�?

提示�Q�由于XML文档是严格的层��l�构(用IE5查看XML文�g�Q�会看见XML文档�c�M��多��兌��菜单)�Q?br />所以我们�Ş象的�U�XML文档为文档树�Q�其中每一对元素称作树的一个节炏V��根元素��是根节炏V�?/p>
最后关闭所有元素：

Eric.Zhou 2006-09-18 09:14 发表评论

Eric.Zhou — Mon, 18 Sep 2006 00:47:00 GMT

技�?/span> 1
　　 XmlNode.InnerText �?/span> .InnerXml 的区别是�Q�前者将内容中的 < �?/span> > 分别变成 < �?/span> > �Q�因此，希望��两�D?/span> XmlDocument 合�ƈ的程序只能��?/span>

XmlDocumentFragment.InnerXml = XmlNode.OuterXml

技�?/span> 2

/XPath: string end-with

技�?/span> 3
　　一�?/span> XML 文档�?/span> Load 时如果失败，��是�Ҏ��不合法；是否�W�合某个 Schema �Q?/span> XSD �Q�的要求则是有效�?/span> (valid) ��查，�Ҏ��是��?/span> XmlValidatingReader 对象�?/span> Schemas �?/span> ValidationType 属性�?/span>
技�?/span> 4
　　 XmlDataDocument �c�L��?/span> XmlDocument �z��出来的，最重要的是增加了一�?/span> DataSet 属性。不�q�这个类不是 System.Xml 提供的，而是 System.Data 提供的。对于��L��要跟数据库打交道的应用程序来��_��反正是要引用 System.Data 的，不如全部�?/span> XmlDataDocument �?/span>
技�?/span> 5
　　如何��?/span> XmlDataDocument 对象中的 DataSet 更新保存到数据库中？ DataSet 本��n有一�?/span> AcceptChanges �Ҏ��Q�所以只需要：

xmlDataDoc.DataSet.AcceptChanges();

Eric.Zhou 2006-09-18 08:47 发表评论