亚洲成人在线视频播放,国产综合香蕉五月婷在线,中文字幕欧美日韩

RSS

Eric.Zhou — Fri, 18 Jan 2008 14:14:00 GMT

摘要: 1�Q�RSS 介绍 RSS是利用XML把一个网站的内容发送给其他�|�站的方式。RSS允许快速浏览新��M��更新�?什么是RSS�Q?RSS是在�U�共享内容的一�U�简易方式（也叫聚合内容�Q�Really Simple Syndication�Q�，Rss允许联合站点内容�Q�Rss定义了一个简单的方式来共享和查看标题及内宏V��Rss文�g可以自动更新�Q�Rss允许个�h查看不同站点�Q�Rss是用XML�~�写的�?��Z��么要使用R... 阅读全文

Eric.Zhou 2008-01-18 22:14 发表评论

XML/XSL-FO

Eric.Zhou — Fri, 18 Jan 2008 06:36:00 GMT

摘要: 在学习XSL-FO之前�Q�你应该已经掌握了XML和XML命名�I�间的基本知识�?1�Q�什么是XSL-FO�Q?XSL-FO 是用于将�l�果格式化成XML数据的语�a��Q�XSL-FO全称为（Extensible Stylesheet Language Formatting Objects�Q�扩展格式化对象样式表语�a��Q�，XSL-FO 是W3C的推荐标准，XSL-FO 现在通常被称为XSL�?XSL-FO 是用�?.. 阅读全文

Eric.Zhou 2008-01-18 14:36 发表评论

Schema (XSD) 教程

Eric.Zhou — Thu, 17 Jan 2008 02:53:00 GMT

Schema (XSD) 教程

Eric.Zhou 2008-01-17 10:53 发表评论

Java 语言�?XPath API

Eric.Zhou — Mon, 18 Sep 2006 05:34:00 GMT

XPath 表达式比�J�琐的文档对象模型（DOM�Q�导航代码要�Ҏ��~�写得多。如果需要从 XML 文档中提取信息，最快捷、最��单的办法��是�?Java�?�E�序中嵌�?XPath 表达式。Java 5 推出�?javax.xml.xpath 包，�q�是一个用�?XPath 文档查询的独立于 XML 对象模型的库�?/blockquote>
如果要告诉别��Z��一加仑牛奶�Q�您会怎么��_��“请��M��一加仑牛奶回来�?�q�是 “从前门出去�Q�向左�{�Q�走三个街区向右转，再走半个街区向右转进入商店。走向四号通道�Q�沿通道��C��c�_��左，拿一瓶一加仑装的牛奶然后到收银台付款。再沿原路回家。�?��直太可笑了。只要在 “请��M��一加仑牛奶回来�?的基��上稍加指�C�，多数成�h都能自己买回牛奶来�?

查询语言和计��机搜烦与此�c�M��。直接说 “找一�?Cryptonomicon 的副本�?要比�~�写搜烦某个数据库的详细逻辑�Ҏ��得多。由于搜索操作的逻辑非常�怼��Q�可以发明一�U�通用语言让您使用 “找�?Neal Stephenson 的所有著作�?�q�样的命令，然后�~�写对特定数据存储执行此�c�L��询的引擎�?

XPath

在众多查询语�a�之中�Q�结构化查询语言�Q�SQL�Q�是一�U�针�Ҏ��询特定类型的关系库而设计和优化的语�a�。其他不那么常见的查询语�a��q�有对象查询语言�Q�OQL�Q�和 XQuery。但本文的主题是 XPath�Q�一�U��ؓ查询 XML 文档而设计的查询语言。比如，下面�q�个��单的 XPath 查询可以在文档中扑ֈ�作者�ؓ Neal Stephenson 的所有图书的标题�Q?/p>
//book[author="Neal Stephenson"]/title
作�ؓ对照�Q�查询同样信息的�U?DOM 搜烦代码�?清单 1 所�C�：

清单 1. 扑ֈ� Neal Stephenson 所有著�?title 元素�?DOM 代码
ArrayList result = new ArrayList(); NodeList books = doc.getElementsByTagName("book"); for (int i = 0; i < books.getLength(); i++) { Element book = (Element) books.item(i); NodeList authors = book.getElementsByTagName("author"); boolean stephenson = false; for (int j = 0; j < authors.getLength(); j++) { Element author = (Element) authors.item(j); NodeList children = author.getChildNodes(); StringBuffer sb = new StringBuffer(); for (int k = 0; k < children.getLength(); k++) { Node child = children.item(k); // really should to do this recursively if (child.getNodeType() == Node.TEXT_NODE) { sb.append(child.getNodeValue()); } } if (sb.toString().equals("Neal Stephenson")) { stephenson = true; break; } } if (stephenson) { NodeList titles = book.getElementsByTagName("title"); for (int j = 0; j < titles.getLength(); j++) { result.add(titles.item(j)); } } }
不论您是否相信，清单 1 中的 DOM 昄��不如��单的 XPath 表达式通用或者健壮。您愿意�~�写、调试和�l�护哪一个？我想�{�案很明显�?

但是虽然有很强的表达能力�Q�XPath �q�不�?Java 语言�Q�事实上 XPath 不是一�U�完整的�~�程语言。有很多东西�?XPath 表达不出来，甚至有些查询也无法表达。比方说�Q�XPath 不能查找国际标准图书�~�码�Q�ISBN�Q�检验码不匹配的所有图书，或者找出境外帐��h��据库昄��Ơ帐的所有作者。幸�q�的是，可以�?XPath �l�合�?Java �E�序中，�q�样��p��发挥两者的优势了：Java �?Java 所擅长的，XPath �?XPath 所擅长的�?

直到最�q�，Java �E�序执行 XPath 查询所需要的应用�E�序�~�程接口�Q�API�Q�还因�Ş形色色的 XPath 引擎而各不相同。Xalan 有一�U?API�Q�Saxon 使用另一�U�，其他引擎则��用其他的 API。这意味着代码往往把您限制��C��U��品上。理��x��况下�Q�最好能够试验具有不同性能特点的各�U�引擎，而不会带来不适当的麻烦或者重新编写代码�?

于是�Q�Java 5 推出�?javax.xml.xpath 包，提供一个引擎和对象模型独立�?XPath 库。这个包也可用于 Java 1.3 及以后的版本�Q�但需要单独安�?Java API for XML Processing (JAXP) 1.3。Xalan 2.7 �?Saxon 8 以及其他产品包含了这个库的实现�?

回页�?/font>

一个简单的例子

我将举例说明如何使用它。然后再讨论一些细节问题。假设要查询一个图书列表，��L�� Neal Stephenson 的著作。具体来��_��q�个图书列表的�Ş式如清单 2 所�C�：

清单 2. 包含图书信息�?XML 文档
Snow Crash Neal Stephenson Spectra 0553380958 14.95 Burning Tower Larry Niven Jerry Pournelle Pocket 0743416910 5.99 Zodiac Neal Stephenson Spectra 0553573862 7.50
抽象工厂

XPathFactory 是一个抽象工厂。抽象工厂设计模式��得这一�U?API 能够支持不同的对象模型，�?DOM、JDOM �?XOM。�ؓ了选择不同的模型，需要向 XPathFactory.newInstance() �Ҏ��传递标识对象模型的�l�一资源标识�W�（URI�Q�。比�?http://xom.nu/ 可以选择 XOM。但实际上，到目前�ؓ�?DOM 是该 API 支持的惟一对象模型�?

查找所有图书的 XPath 查询非常��单：//book[author="Neal Stephenson"]。�ؓ了找��些图书的标题�Q�只要增加一步，表达式就变成�?//book[author="Neal Stephenson"]/title。最后，真正需要的�?title 元素的文本节点孩子。这��p��求再增加一步，完整的表辑ּ��是 //book[author="Neal Stephenson"]/title/text()�?

现在我提供一个简单的�E�序�Q�它�?Java 语言中执行这个查询，然后把找到的所有图书的标题打印出来。首先，需要将文档加蝲��C��?DOM Document 对象中。�ؓ了简化�v见，假设该文档在当前工作目录�?books.xml 文�g中。下面的��单代码片�D�解析文档�ƈ建立对应�?Document 对象�Q?

清单 3. �?JAXP 解析文档
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); factory.setNamespaceAware(true); // never forget this! DocumentBuilder builder = factory.newDocumentBuilder(); Document doc = builder.parse("books.xml");
到目前�ؓ止，�q�仅仅是标准�?JAXP �?DOM�Q�没有什么新鲜的�?

接下来创�?XPathFactory�Q?/p>
XPathFactory factory = XPathFactory.newInstance();
然后使用�q�个工厂创徏 XPath 对象�Q?
XPath xpath = factory.newXPath();
XPath 对象�~�译 XPath 表达式：
PathExpression expr = xpath.compile("http://book[author='Neal Stephenson']/title/text()");
直接求�?/b>

如果 XPath 表达式只使用一�ơ，可以跌��~�译步骤直接�?XPath 对象调用 evaluate() �Ҏ��。但是，如果同一个表辑ּ�要重复��用多�ơ，�~�译可能更快一些�?

最后，计算 XPath 表达式得到结果。表辑ּ�是针对特定的上下文节点计��的�Q�在�q�个例子中是整个文档。还必须指定�q�回�c�d��。这里要求返回一个节炚w��Q?
Object result = expr.evaluate(doc, XPathConstants.NODESET);
可以��结果强制�{化成 DOM NodeList�Q�然后遍历列表得到所有的标题�Q?
NodeList nodes = (NodeList) result; for (int i = 0; i < nodes.getLength(); i++) { System.out.println(nodes.item(i).getNodeValue()); }
清单 4 把上�q�片�D늻�合到了一个程序中。还要注意，�q�些�Ҏ��可能抛出一些检查异常，�q�些异常必须�?throws 子句中声明，但是我在上面把它们掩盖�v来了�Q?

清单 4. 用固定的 XPath 表达式查�?XML 文档的完整程�?/b>

import java.io.IOException; import org.w3c.dom.*; import org.xml.sax.SAXException; import javax.xml.parsers.*; import javax.xml.xpath.*; public class XPathExample { public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException, XPathExpressionException { DocumentBuilderFactory domFactory = DocumentBuilderFactory.newInstance(); domFactory.setNamespaceAware(true); // never forget this! DocumentBuilder builder = domFactory.newDocumentBuilder(); Document doc = builder.parse("books.xml"); XPathFactory factory = XPathFactory.newInstance(); XPath xpath = factory.newXPath(); XPathExpression expr = xpath.compile("http://book[author='Neal Stephenson']/title/text()"); Object result = expr.evaluate(doc, XPathConstants.NODESET); NodeList nodes = (NodeList) result; for (int i = 0; i < nodes.getLength(); i++) { System.out.println(nodes.item(i).getNodeValue()); } } }

XPath 数据模型

每当混合使用诸如 XPath �?Java �q�样两种不同的语�a��Ӟ��必定会有某些��两者粘合在一��L��明显接缝。�ƈ非一切都很合拍。XPath �?Java 语言没有同样的类型系�l�。XPath 1.0 只有四种基本数据�c�d��Q?/p>

node-set

number

boolean

string

当然�Q�Java 语言有更多的数据�c�d��Q�包括用户定义的对象�c�d��?/p>
多数 XPath 表达式，特别是位�|��\径，都返回节炚w��。但是还有其他可能。比如，XPath 表达�?count(//book) �q�回文档中的图书数量。XPath 表达�?count(//book[@author="Neal Stephenson"]) > 10 �q�回一个布��|��如果文档�?Neal Stephenson 的著作超�q?10 本则�q�回 true�Q�否则返�?false�?

evaluate() �Ҏ��被声明�ؓ�q�回 Object。实际返回什么依赖于 XPath 表达式的�l�果以及要求的类型。一般来��_��XPath �?/p>

number 映射�?java.lang.Double

string 映射�?java.lang.String

boolean 映射�?java.lang.Boolean

node-set 映射�?org.w3c.dom.NodeList

XPath 2

前面一直假设您使用的是 XPath 1.0。XPath 2 大大扩展和修改了�c�d��pȝ��。Java XPath API 支持 XPath 2 所需的主要修�Ҏ��?XPath 2 新数据类型增加常量�?

�?Java 中计��?XPath 表达式时�Q�第二个参数指定需要的�q�回�c�d��。有五种可能�Q�都�?javax.xml.xpath.XPathConstants �c�M��命名了常量：

XPathConstants.NODESET

XPathConstants.BOOLEAN

XPathConstants.NUMBER

XPathConstants.STRING

XPathConstants.NODE

最后一�?XPathConstants.NODE 实际上没有匹配的 XPath �c�d��。只有知�?XPath 表达式只�q�回一个节�Ҏ��者只需要一个节�Ҏ��才��用它。如�?XPath 表达式返回了多个节点�q�且指定�?XPathConstants.NODE�Q�则 evaluate() 按照文档��序�q�回�W�一个节炏V��如�?XPath 表达式选择了一个空集�ƈ指定�?XPathConstants.NODE�Q�则 evaluate() �q�回 null�?

如果不能完成要求的�{换，evaluate() ��抛�?XPathException�?

名称�I�间上下�?/font>

�?XML 文档中的元素在名�U�空间中�Q�查询该文档�?XPath 表达式必��M��用相同的名称�I�间。XPath 表达式不一定要使用相同的前�~��Q�只需要名�U�空�?URI 相同卛_��。事实上�Q�如�?XML 文档使用默认名称�I�间�Q�那么尽��目标文档没有��用前�~��Q�XPath 表达式也必须使用前缀�?

但是�Q�Java �E�序不是 XML 文档�Q�因此不能用一般的名称�I�间解析。必��L��供一个对象将前缀映射到名�U�空�?URI。该对象�?javax.xml.namespace.NamespaceContext 接口的实例。比如，假设图书文档攑֜� http://www.example.com/books 名称�I�间中，�?清单 5 所�C�：

清单 5. 使用默认名称�I�间�?XML 文档

Snow Crash Neal Stephenson Spectra 0553380958 14.95

查找 Neal Stephenson 全部著作标题�?XPath 表达式就要改�?//pre:book[pre:author="Neal Stephenson"]/pre:title/text()。但是，必须��前�~� pre 映射�?URI http://www.example.com/books�?code>NamespaceContext 接口�?Java 软�g开发工��L��Q�JDK�Q�或 JAXP 中没有默认实��C��乎有点笨�Q�但��实如此。不�q�，自己实现也不难�?a >清单 6 对一个名�U�空间给��Z��单的实现。还需要映��?xml 前缀�?

清单 6. �l�定一个名�U�空间和默认名称�I�间的简单上下文

import java.util.Iterator; import javax.xml.*; import javax.xml.namespace.NamespaceContext; public class PersonalNamespaceContext implements NamespaceContext { public String getNamespaceURI(String prefix) { if (prefix == null) throw new NullPointerException("Null prefix"); else if ("pre".equals(prefix)) return "http://www.example.org/books"; else if ("xml".equals(prefix)) return XMLConstants.XML_NS_URI; return XMLConstants.NULL_NS_URI; } // This method isn't necessary for XPath processing. public String getPrefix(String uri) { throw new UnsupportedOperationException(); } // This method isn't necessary for XPath processing either. public Iterator getPrefixes(String uri) { throw new UnsupportedOperationException(); } }

使用映射存储�l�定和增�?setter �Ҏ��实现名称�I�间上下文的重用也不难�?

创徏 NamespaceContext 对象后，在编译表辑ּ�之前��其安装�?XPath 对象上。以后就可以像以前一��h��用这些前�~�查询了。比如：

清单 7. 使用名称�I�间�?XPath 查询

XPathFactory factory = XPathFactory.newInstance(); XPath xpath = factory.newXPath(); xpath.setNamespaceContext(new PersonalNamespaceContext()); XPathExpression expr = xpath.compile("http://pre:book[pre:author='Neal Stephenson']/pre:title/text()"); Object result = expr.evaluate(doc, XPathConstants.NODESET); NodeList nodes = (NodeList) result; for (int i = 0; i < nodes.getLength(); i++) { System.out.println(nodes.item(i).getNodeValue()); }

函数求解�?/font>

有时候，�?Java 语言中定义用�?XPath 表达式的扩展函数很有用。这些函数可以执行用�U?XPath 很难或者无法执行的��d��。不�q�必��L��真正的函敎ͼ�而不是随意的�Ҏ��。就是说不能有副作用。（XPath 函数可以按照��L��的顺序求��g�Q意多�ơ。）

通过 Java XPath API 讉K��的扩展函数必��d��?javax.xml.xpath.XPathFunction 接口。这个接口只声明了一个方�?evaluate�Q?

public Object evaluate(List args) throws XPathFunctionException

该方法必��返�?Java 语言能够转换�?XPath 的五�U�类型之一�Q?

String

Double

Boolean

Nodelist

Node

比如�Q?a >清单 8 昄��了一个扩展函敎ͼ�它检�?ISBN 的校验和�q�返�?Boolean。这个校验和的基本规则是前九位数的每一位乘上它的位�|�（即第一位数乘上 1�Q�第二位��C��?2�Q�依�ơ类推）。将�q�些数加��h��然后取除�?11 的余数。如果余数是 10�Q�那么最后一位数��是 X�?

清单 8. ��?ISBN �?XPath 扩展函数

import java.util.List; import javax.xml.xpath.*; import org.w3c.dom.*; public class ISBNValidator implements XPathFunction { // This class could easily be implemented as a Singleton. public Object evaluate(List args) throws XPathFunctionException { if (args.size() != 1) { throw new XPathFunctionException("Wrong number of arguments to valid-isbn()"); } String isbn; Object o = args.get(0); // perform conversions if (o instanceof String) isbn = (String) args.get(0); else if (o instanceof Boolean) isbn = o.toString(); else if (o instanceof Double) isbn = o.toString(); else if (o instanceof NodeList) { NodeList list = (NodeList) o; Node node = list.item(0); // getTextContent is available in Java 5 and DOM 3. // In Java 1.4 and DOM 2, you'd need to recursively // accumulate the content. isbn= node.getTextContent(); } else { throw new XPathFunctionException("Could not convert argument type"); } char[] data = isbn.toCharArray(); if (data.length != 10) return Boolean.FALSE; int checksum = 0; for (int i = 0; i < 9; i++) { checksum += (i+1) * (data[i]-'0'); } int checkdigit = checksum % 11; if (checkdigit + '0' == data[9] || (data[9] == 'X' && checkdigit == 10)) { return Boolean.TRUE; } return Boolean.FALSE; } }

下一步让�q�个扩展函数能够�?Java �E�序中��用。�ؓ此，需要在�~�译表达式之前向 XPath 对象安装 javax.xml.xpath.XPathFunctionResolver。函数求解器��函数的 XPath 名称和名�U�空�?URI 映射到实现该函数�?Java �c�R�?a >清单 9 是一个简单的函数求解器，��扩展函�?valid-isbn 和名�U�空�?http://www.example.org/books 映射�?清单 8 中的�c�R��比如，XPath 表达�?//book[not(pre:valid-isbn(isbn))] 可以扑ֈ� ISBN 校验和不匚w��的所有图书�?

清单 9. 识别 valid-isbn 扩展函数的上下文

iimport javax.xml.namespace.QName; import javax.xml.xpath.*; public class ISBNFunctionContext implements XPathFunctionResolver { private static final QName name = new QName("http://www.example.org/books", "valid-isbn"); public XPathFunction resolveFunction(QName name, int arity) { if (name.equals(ISBNFunctionContext.name) && arity == 1) { return new ISBNValidator(); } return null; } }

�׃��扩展函数必须有名�U�空��_��所以计��包含扩展函数的表达式时必须使用 NamespaceResolver�Q�即便查询的文档没有使用��M��名称�I�间。由�?XPathFunctionResolver�?code>XPathFunction �?NamespaceResolver 都是接口�Q�如果方便的话可以将它们攑֜�所有的�c�M��?

�l�束�?/font>

�?SQL �?XPath �q�样的声明性语�a��~�写查询�Q�要比��?Java �?C �q�样的命令式语言�Ҏ��得多。但是，�?Java �?C �q�样的图灵完整语�a��~�写复杂的逻辑�Q�又�?SQL �?XPath �q�样的声明性语�a��Ҏ��得多。所�q�的是，通过使用 Java Database Connectivity (JDBC) �?javax.xml.xpath 之类�?API 可以��两者结合�v来。随着世界上越来越多的数据转向 XML�Q?code>javax.xml.xpath ��与 java.sql 一样变得越来越重要�?/p>

Eric.Zhou 2006-09-18 13:34 发表评论

Eric.Zhou — Mon, 18 Sep 2006 01:18:00 GMT
摘要: 当前位置当我们��用XSLT处理XML源文档是�Q�我们用Context来表�C�当前正在被模板处理的节点位�|�。比如xsl:template match="/"语句中表�C�Context在文档的�?root)节点。我不知道如何准��的��译Context�q�个词，它类��g��C语言里的指针�Q�表�C�程序当前运行的位置。理解Context对于正确处理XSL模板非常重要�Q�当您的XSL模板输出的文档和您想要的不一��P��最�?.. 阅读全文

Eric.Zhou 2006-09-18 09:18 发表评论

xsl�q�程解析

Eric.Zhou — Mon, 18 Sep 2006 01:14:00 GMT

�q�是标准的XML文档的首行代码，因�ؓXSLT本��n也是XML文档�?br />encoding属性用来定义文档��用的�~�码形式�Q�iso-8859-1主要支持西欧和北��的语言�~�码�?br />如果你想使用��体中文，那么��应该写成：

接下�ȝ��代码�?

�q�是标准的XSLT文�g首行代码。xsl:stylesheet代码的意思是��文档作��Z��个样式表�?stylesheet)处理�?br />xmlns:xsl属性是一个名字空间声明，和XML中的名字�I�间使用�Ҏ��一��P��用来防止元素名称重复和�؜乱�?br />其中前缀xsl的意思是文档中��用的元素遵守W3C的XSLT规范�?br />最后的version属性说明样式表只采用XSLT 1.0的标准功能，�q�也是目前仅有的标准�?/p>

一�?lt;xsl:template>元素定义一个模板规则。属性match="/"说明XML源文档中�Q�这个模板规则作用的��L��?/"是一�U�XPath语法�Q�我们在后面��详�l�讲�q�ͼ��q�里�?/"代表XML�l�构树的�?root)�?/p>
接下�ȝ��代码�?

First XSLT Example

说明�Q�当模板规则被触发，模板的内容就会控制输出的�l�果。例子中�Q�模板大部分内容由HTML�?br />素和文本构成。只�?lt;xsl:value-of>元素是XSLT语法�Q�这�?lt;xsl:value-of>的作用是拯��原文档中�?br />一个节点的值到输出文档。而select属性则详细指定要处理的节点名称。这是XPath语法�Q?greeting"
的意思就是寻找根节点名�ؓgreeting的元素，�q�用模板来处理这个节炏V��具体的��是扑ֈ�
元素�Q�然后将元素的�?hello world"按模板样式拷贝到输出文�g�?

提示�Q�由于XML文档是严格的层��l�构(用IE5查看XML文�g�Q�会看见XML文档�c�M��多��兌��菜单)�Q?br />所以我们�Ş象的�U�XML文档为文档树�Q�其中每一对元素称作树的一个节炏V��根元素��是根节炏V�?/p>
最后关闭所有元素：

Eric.Zhou 2006-09-18 09:14 发表评论