亚洲国内精品视频,中文字幕av日韩,亚洲一级二级三级

vso — Thu, 12 Oct 2006 08:55:00 GMT

CODE:

						
								
import java.io.*;
import org.jdom.*;
import org.jdom.input.*;
import org.jdom.input.*;
import org.jdom.output.*;

public class test1 {
    public void BuildXMLDoc() throws IOException, JDOMException {
        Element eeeRoot, eee1, eee2;
        Document Doc;
        eeeRoot = new Element("employees_information");
        Doc = new Document(eeeRoot);
        eeeRoot = Doc.getRootElement();

        eee1 = new Element("name");
        eee2 = eee1.setText("C.Y. Shen");
        //eee2 = eee1.addAttribute("emp_id", "001");
        eee1 = eeeRoot.addContent(eee2);

        eee1 = new Element("age");
        eee2 = eee1.setText("43");
        eee1 = eeeRoot.addContent(eee2);

        eee1 = new Element("sex");
        eee2 = eee1.setText("Male");
        eee1 = eeeRoot.addContent(eee2);
        XMLOut.setEncoding("gb2312") �Q� XMLOutputter XMLOut = new XMLOutputter();
        XMLOut.output(Doc, new FileOutputStream("test1.xml"));
    }

    public static void main(String[] args) {
        try {
            test1 s1 = new test1();
            System.out.println("Now we build an XML document .....");
            s1.BuildXMLDoc();
        } catch (Exception e) {
            System.out.println(e.getMessage());
        }
    }
}

输出如下�Q?br />
-

C.Y. Shen
43
Male

vso 2006-10-12 16:55 发表评论

通过XSLT讉K��Java代码[转]

vso — Thu, 12 Oct 2006 08:53:00 GMT

假如你希望将XML数据转换为固定宽度和�U�文本的字符东y��—这刚好是XSLT不太方便实现的一个特性，或者，也许你希望在XML文�g中执行词语替换。在�q�些情况下，当你的事务超��Z��XSLT自��n的处理能力时�Q�可以通过在你的XSLT处理器中调用Java函数来完成�?br />我看到过利用�c�M��VBScript和Jscript的脚本语�a�完成�Ҏ��处理的例子（针对微��Y解析器的�Q�，但是如何利用Java来执行特�D�的处理�q�不是特别地明显。尽��如此，��单地��_��可以在XSLT处理器中通过XML命名�I�间�Q�namespaces�Q�调用Java函数来实现。Java与XSLT的结合�ؓ构徏健壮的应用程序提供了强有力的�Ҏ��?br />使用定制的命名空�?br />命名�I�间是通过使用�l�一资源标识�W?URI)来修饰限定XSL中元素和属性名�U�的一�U�方法。例如，常见的XSL元素需要有xsl命名�I�间前缀来修饎ͼ�xsl通过使用XSLT命名�I�间URI来声明：
xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
但是�q�不局限于使用XSLT命名�I�间�Q�你完全可以自由地声明你自己定制的命名空��_��q�用它们来识别定制的XSLT标签和范围�?br />你必��M��用定制的命名�I�间前缀来完成对外部函数的调用，例如�Q�mynspace:fundtion()�Q�该命名�I�间前缀mynspace�Q�必��M��一个命名空间URI相关联，例如�Q?br />xmlns:myspace="d:///XMLprogs/mynamespace"
一般的Java�l�定使用命名�I�间URI标识Java�c�d��数的位置。对用于本文�C�Z��代码的Xalan XSLT处理器（版本1.2.2�Q�来��_��命名�I�间URI必须��h��URI-stem/packagename的�Ş式。如果你使用了XT�Q�那么你的命名空间应该有如下格式�Q?br />xmlns:mynspace="d://XMLprogs/mynamespace.myclassname
�q�种情况下，你可以��用XSLT代码调用来自myclassname的Java函数�?br />�l�定外部Java函数
此处�l�出在XSLT模板内部�l�定Java语言�~�写的外部函数的�q�程�?br />��你自己定制的命名空间作为它们的属性添加到样式表（stylesheet�Q�元素或者你的模板中�?br />��保你的Java�c�L��件所在目录位于你的XSLT处理器所�q�行的Java虚拟机（JVM�Q�的CLASSPATH中�?br />对于静态方法，可以使可以用完全合格的类名称加上�Ҏ��和�Q何必需的的参数�Q�当然还有命名空间前�~��?br />对于非静态方法，首先创徏�c�d��例，然后调用该方法�ƈ提供��M��必需的参数�?br />例如�Q�下面的样式表元素包含一个定制的命名�I�间声明�Q?br />

CODE:

在声明了�q�个命名�I�间后，可以讉K��该类的�Q何静态方法，像这��P��

CODE:
 

如果�Ҏ��不是静态的�Q�那么必��首先调用类构造器�Q�例如：

CODE:
 

Java包\"mynamespace"必须位于"d://XMLprogs"目录中�?br />注意�Q��用可选属性xsl:exclude-result-prefixes�Q�预防了java命名�I�间被包括到�l�果文档中�?br />

CODE:
 

上面的XSLT代码中，行调用位于mynamespace包中名�ؓDateClass的类的静态方法displayDate()�?br />利用�q�种技术，你可以调用�Q何Java�c�L��法——包括那些需要参数的�Ҏ��——参数来自于你的XSLT模板�?br />本文涉及的代码：date.xsl

CODE:














DateClass.java
packagemynamespace;
importjava.util.Date;
public class DateClass{
public static String displayDate(){
Date d = new Date();
returnd.toString();
}
}

要运行这些代码，需要：
创徏文�g�?d:XMLProgsmynamespace"�?br />��DateClass.java文�g攑օ�上述路径�q�编译得到DateClass.class文�g�?br />��?d:XMLProgsmynamespace"攑օ�classpath变量中�?br />利用XSLT处理器，例如XT或XALAN��该XSL文�g和具体的XML文�g兌��。�?img src ="http://www.aygfsteel.com/vso/aggbug/74812.html" width = "1" height = "1" />

vso 2006-10-12 16:53 发表评论

vso — Thu, 12 Oct 2006 08:51:00 GMT

SAX概念
SAX是Simple API for XML的羃写，它�ƈ不是由W3C官方所提出的标准，可以说是“民间”的事实标准。实际上�Q�它是一�U�社区性质的讨��Z�物。虽然如此，在XML中对SAX的应用丝毫不比DOM��，几乎所有的XML解析器都会支持它。�?br />
与DOM比较而言�Q�SAX是一�U�轻量型的方法。我们知道，在处理DOM的时候，我们需要读入整个的XML文档�Q�然后在内存中创建DOM树，生成DOM树上的每个Node对象。当文档比较��的时候，�q�不会造成什么问题，但是一旦文档大��h��Q�处理DOM��׃��变得相当�Ҏ��费力。特别是其对于内存的需求，也将是成倍的增长�Q�以至于在某些应用中使用DOM是一件很不划��的事（比如在applet中）。这时候，一个较好的替代解决�Ҏ��是SAX。�?br />
SAX在概念上与DOM完全不同。首先，不同于DOM的文档驱动，它是事�g驱动的，也就是说�Q�它�q�不需要读入整个文档，而文档的��d��q�程也就是SAX的解析过�E�。所谓事仉��动，是指一�U�基于回调（callback�Q�机制的�E�序�q�行�Ҏ��。（如果你对Java新的代理事�g模型比较清楚的话�Q�就会很�Ҏ��理解�q�种机制了）

在XMLReader接受XML文档�Q�在��d��XML文档的过�E�中��p��行解析，也就是说��d��文档的过�E�和解析的过�E�是同时�q�行的，�q�和DOM区别很大。解析开始之前，需要向XMLReader注册一个ContentHandler�Q�也��是相当于一个事件监听器�Q�在ContentHandler中定义了很多�Ҏ��Q�比如startDocument()�Q�它定制了当在解析过�E�中�Q�遇到文档开始时应该处理的事情。当XMLReader��d��合适的内容�Q�就会抛出相应的事�g�Q��ƈ把这个事件的处理权代理给ContentHandler�Q�调用其相应的方法进行响应。�?br />
�q�样泛泛的说来或许有些不�Ҏ��理解�Q�别急，后面的例子会让你明白SAX的解析过�E�。看看这个简单XML文�g�Q��?br />

Ogden Nash
Fleas
Adam

当XMLReader��d��标签�Ӟ��׃��调用ContentHandler.startElement()�Ҏ��Q��ƈ把标�{�֐�POEM作�ؓ参数传递过厅R��在你实现的startElement()�Ҏ��中需要做相应的动作，以处理当出现时应该做的事情。各个事仉��着解析的过�E�（也就是文档读入的�q�程�Q�一个个��序的被抛出�Q�相应的�Ҏ��也会被顺序的调用�Q�最后，当解析完成，�Ҏ��都被调用后，�Ҏ��档的处理也就完成了。下面的�q�个表，列出了在解析上面的那个XML文�g的时候，��序被调用的�Ҏ��Q��?br />

ContentHandler实际上是一个接口，当处理特定的XML文�g的时候，��需要�ؓ其创��Z��个实��C��ContentHandler的类来处理特定的事�g�Q�可以说�Q�这个实际上��是SAX处理XML文�g的核心。下面我们来看看定义在其中的一些方法：

void characters(char[] ch, int start, int length)�Q��?br />
�q�个�Ҏ��用来处理在XML文�g中读到字�W�串�Q�它的参数是一个字�W�数�l�，以及��d��的这个字�W�串在这个数�l�中的�v始位�|�和长度�Q�我们可以很�Ҏ��的用String�cȝ��一个构造方法来获得�q�个字符串的String�c�：String charEncontered=new String(ch,start,length)。�?br />
void startDocument()�Q��?br />
当遇到文档的开头的时候，调用�q�个�Ҏ��Q�可以在其中做一些预处理的工作。�?br />
void endDocument()�Q��?br />
和上面的�Ҏ��相对应，当文档结束的时候，调用�q�个�Ҏ��Q�可以在其中做一些善后的工作。�?br />
void startElement(java.lang.String namespaceURI, java.lang.String localName, java.lang.String qName, Attributes atts)

当读��C��个开始标�{��时候，会触发这个方法。在SAX1.0版本中�ƈ不支持名域，而在新的2.0版本中提供了对名域的支持�Q�这儿参��C��的namespaceURI��是名域�Q�localName是标�{�֐��Q�qName是标�{��修饰前缀�Q�当没有使用名域的时候，�q�两个参数都未null。而atts是这个标�{�所包含的属性列表。通过atts�Q�可以得到所有的属性名和相应的倹{��要注意的是SAX中一个重要的特点��是它的��式处理�Q�在遇到一个标�{��时候，它�ƈ不会�U�录下以前所��到的标�{�，也就是说�Q�在startElement()�Ҏ��中，所有你所知道的信息，��是标签的名字和属性，至于标签的嵌套结构，上层标签的名字，是否有子元属�{�等其它与结构相关的信息�Q�都是不得而知的，都需要你的程序来完成。这使得SAX在编�E�处理上没有DOM来得那么方便。�?br />
void endElement(java.lang.String namespaceURI, java.lang.String localName, java.lang.String qName)

�q�个�Ҏ��和上面的�Ҏ��相对应，在遇到结束标�{��时候，调用�q�个�Ҏ��。�?br />
因�ؓContentHandler是一个接口，在��用的时候可能会有些不方便，因而，SAX中还为其制定了一个Helper�c�：DefaultHandler�Q�它实现了这个接口，但是其所有的�Ҏ��体都为空�Q�在实现的时候，你只需要��承这个类�Q�然后重载相应的�Ҏ��卛_��。�?br />
OK�Q�到�q�儿SAX的基本知识已�l�差不多讲完了，下面我们来看看两个具体的例子�Q�以更好的理解SAX地用法。�?br />
SAX�~�程实例
我们�q�是沿用讲DOM的时候��用的那个文档例子�Q�但首先�Q�我们先看一个简单一些的应用�Q�我们希望能够统计一下XML文�g中各个标�{�և�现的�ơ数。这个例子很��单，但是��以阐述SAX�~�程的基本思�\了。�?br />
一开始当然还是import语句了：

import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.*;
import org.xml.sax.*;
import org.xml.sax.helpers.*;
import java.util.*;
import java.io.*;

然后�Q�我们创��Z��个��承于DefaultHandler的类�Q�具体的�E�序逻辑在这儿可以暂且放在一边，要注意的是程序的�l�构�Q��?br />
public class SAXCounter extends DefaultHandler {
private Hashtable tags; //�q�个Hashtable用来记录tag出现的次�?br />// 处理文档前的工作\
public void startDocument() throws SAXException {
tags = new Hashtable();//初始化Hashtable
}
//�Ҏ��一个开始元属进行处理\
public void startElement(String namespaceURI, String localName,
String rawName, Attributes atts)
throws SAXException
{
String key = localName;
Object value = tags.get(key);
if (value == null) {
// 如果是新��到的标�{�，�q�在Hastable中添加一条记�?br />tags.put(key, new Integer(1));
} else {
// 如果以前��到�q�，得到其计数��|��q�加1
int count = ((Integer)value).intValue();
count++;
tags.put(key, new Integer(count));
}
}
//解析完成后的�l�计工作\
public void endDocument() throws SAXException {
Enumeration e = tags.keys();
while (e.hasMoreElements()) {
String tag = (String)e.nextElement();
int count = ((Integer)tags.get(tag)).intValue();
System.out.println("Tag <" + tag + "> occurs " + count
+ " times");
}
}
//�E�序入口�Q�用来完成解析工作\
static public void main(String[] args) {
String filename = null;
boolean validation = false;
filename="links.xml";
SAXParserFactory spf = SAXParserFactory.newInstance();
XMLReader xmlReader = null;
SAXParser saxParser=null;
try {
// 创徏一个解析器SAXParser对象\
saxParser = spf.newSAXParser();
// 得到SAXParser中封装的SAX XMLReader
xmlReader = saxParser.getXMLReader();
} catch (Exception ex) {
System.err.println(ex);
System.exit(1);
}
try {
//使用指定的ContentHandler�Q�解析给XML文�g�Q�这儿要注意的是�Q��ؓ�?br />//�E�序的简单�v见，�q�儿��主�E�序和ContentHandler攑֜�了一赗��实际上
//main�Ҏ��中所作的所有事情，都与ContentHandler无关�?br />xmlReader.parse(new File(filename),new SAXCounter());
} catch (SAXException se) {
System.err.println(se.getMessage());
System.exit(1);
} catch (IOException ioe) {
System.err.println(ioe);
System.exit(1);
}
}
}

我们来看看这�D늨�序作了些什么，在main()�Ҏ��中，主要做的��是创徏解析器，然后解析文档。实际上�Q�在�q�儿创徏SAXParser对象的时候，��Z��使程序代码于具体的解析器无关�Q��用了同DOM中一��L��设计技巧：通过一个SAXParserFactory�c�L��创徏具体的SAXParser对象�Q�这��P��当需要��用不同的解析器的时候，要改变的�Q�只是一个环境变量的��|��而程序的代码可以保持不变。这��是FactoryMethod模式的思想。在�q�儿不再具体讲了�Q�如果还有不明白的，可以参看上面DOM中的解释�Q�原理是一��L��。�?br />
不过在这儿还有一点点要注意的地方�Q�就是SAXParser�c�d��XMLReader�c�M��间的关系。你可能有些�q�L��了吧�Q�实际上SAXParser是JAXP中对XMLReader的一个封装类�Q�而XMLReader是定义在SAX2.0�U�的一个用来解析文档的接口。你可以同样的调用SAXParser或者XMLReader中的parser()�Ҏ��来解析文档，效果是完全一��L��。不�q�在SAXParser中的parser()�Ҏ��接受更多的参敎ͼ�可以对不同的XML文档数据源进行解析，因而��用�v来要比XMLReader要方便一些。�?br />
�q�个例子仅仅涉及了SAX的一点皮毛，而下面的�q�个�Q�可��p��高��一些了。下面我们要实现的功能，在DOM的例子中已经有实��C��Q�就是从XML文档中读出内容�ƈ格式化输出，虽然�E�序逻辑看�v来还是很��单，但是SAX可不比DOM哦，看着吧。�?br />
前面说过�Q�当遇到一个开始标�{��时候，在startElement()�Ҏ��中，我们�q�不能够得到�q�个标签在XML文档中所处的位置。这在处理XML文档的时候是个大�ȝ��Q�因为在XML中标�{��语义�Q�有一部分是由其所处的位置所军_��的。而且在一些需要验证文档结构的�E�序中，�q�更是一个问题。当�Ӟ��没有解决不了的问题了�Q�我们可以��用一个栈来实现对文档�l�构的纪录。�?br />
栈的特点是先�q�先出，我们现在的想法是�Q�在startElemnt()�Ҏ��中用push��这个标�{��名字��d��到栈中，在endElement()�Ҏ��中在把它pop出来。我们知道对一个结构良好的XML而言�Q�其嵌套�l�构是完备的�Q�每一个开始标�{��M��对应一个结束标�{�，而且不会出现标签嵌套之间的错位。因而，每一�ơstartElement()�Ҏ��的调用，必然会对应一个endElement()�Ҏ��的调用，�q�样push和pop也是成对出现的，我们只需要分析栈的结构，��可以很�Ҏ��的知道当前标�{�所处在文档�l�构中的位置了。�?br />
public class SAXReader extends DefaultHandler {
java.util.Stack tags=new java.util.Stack();
//--------------XML Content-------------
String text=null;
String url=null;
String author=null;
String description=null;
String day=null;
String year=null;
String month=null;
//----------------------------------------------
public void endDocument() throws SAXException {
System.out.println("------Parse End--------");
}
public void startDocument() throws SAXException {
System.out.println("------Parse Begin--------");
}
public void startElement(String p0, String p1, String p2, Attributes p3) throws SAXException {
tags.push(p1);
}
public void endElement(String p0, String p1, String p2) throws SAXException {
tags.pop();
//一个link节点的信息收集齐了，��其格式化输出\
if (p1.equals("link")) printout();
}
public void characters(char[] p0, int p1, int p2) throws SAXException {
//从栈中得到当前节点的信息
String tag=(String) tags.peek();
if (tag.equals("text")) text=new String(p0,p1,p2);
else if (tag.equals("url")) url=new String(p0,p1,p2);
else if (tag.equals("author")) author=new String(p0,p1,p2);
else if (tag.equals("day")) day=new String(p0,p1,p2);
else if (tag.equals("month")) month=new String(p0,p1,p2);
else if (tag.equals("year")) year=new String(p0,p1,p2);
else if (tag.equals("description")) year=new String(p0,p1,p2);
}
private void printout(){
System.out.print("Content: ");
System.out.println(text);
System.out.print("URL: ");
System.out.println(url);
System.out.print("Author: ");
System.out.println(author);
System.out.print("Date: ");
System.out.println(day+"-"+month+"-"+year);
System.out.print("Description: ");
System.out.println(description);
System.out.println();
}
static public void main(String[] args) {
String filename = null;
boolean validation = false;
filename="links.xml";
SAXParserFactory spf = SAXParserFactory.newInstance();
SAXParser saxParser=null;
try {
saxParser = spf.newSAXParser();
} catch (Exception ex) {
System.err.println(ex);
System.exit(1);
}
try {
saxParser.parse(new File(filename),new SAXReader());
} catch (SAXException se) {
System.err.println(se.getMessage());
System.exit(1);
} catch (IOException ioe) {
System.err.println(ioe);
System.exit(1);
}
}
}

在这儿虽然没有��用到栈的分析�Q�但实际上栈的分析是一件很�Ҏ��的事情，应�ؓjava.util.Stack�l�承了java.util.Vector�c�，而且Stack中的元素是按栈的�l�构由底至上排列的，因个�Q�我们可以��用Vector�cȝ��size()�Ҏ��来得到Stack的元素个敎ͼ��q�可以��用Vector的get(int)�Ҏ��来得到具体的每一个元属。实际上�Q�如果把Stack的元素从底向上逐一排列出来�Q�我们就得到了从XML根节点到当前节点的一条唯一的�\径，有了�q�条路径的信息，文档的结构就在清楚不�q�了。�?br />
��节
好了�Q�到�q�儿为止�Q�我们已�l�掌握了对于XML�~�程的两大利器：DOM和SAX�Q�也知道了该如何在一个Java�E�序中��用它们。DOM�~�程相对��单，但是速度比较慢，占用内存多，而SAX�~�程复杂一些，但是速度快，占用内存��。所以，我们应该�Ҏ��不同的环境选择使用不同的方法。大部分的XML应用基本都可以用它们来解冟뀂需要特别说明的是，DOM和SAX其实都是语言无关的，�q��Java所独有�Q�也��是��_��只要有相应的语言实现�Q�DOM和SAX可以应用在�Q何面向对象的语言中。�?br />
上面我们介绍了XML文档的读入，内容提取�Q�以及文档添加和修改的一些方法。还有一�cȝ��问题��是XML文档的�{换，虽然用DOM和SAX也可以解冻I��但是实现��h��很复杂，而应用XSLT��׃��单许多。这个问题，�W�者将会在以后的文章中再和大家详细讨论

vso 2006-10-12 16:51 发表评论

vso — Thu, 12 Oct 2006 08:50:00 GMT

DOM初步

DOM是Document Object Model的羃写，��x��档对象模型。前面说�q�，XML��数据组�l��ؓ一颗树�Q�所以DOM��是对这颗树的一个对象描叙。通俗的说�Q�就是通过解析XML文档�Q��ؓXML文档在逻辑上徏立一个树模型�Q�树的节�Ҏ��一个个对象。我们通过存取�q�些对象��p��够存取XML文档的内宏V��?br />
下面我们来看一个简单的例子�Q�看看在DOM中，我们是如何来操作一个XML文档的。�?br />
�q�是一个XML文档�Q�也是我们要操作的对象：

CODE:




Good-bye serialization, hello Java!

下面�Q�我们需要把�q�个文档的内容解析到一个个的Java对象中去供程序��用，利用JAXP�Q�我们只需几行代码��p��做到�q�一炏V��首先，我们需要徏立一个解析器工厂�Q�以利用�q�个工厂来获得一个具体的解析器对象：

CODE:


DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

我们在这里��用DocumentBuilderFacotry的目的是��Z��创徏与具体解析器无关的程序，当DocumentBuilderFactory�cȝ��静态方法newInstance()被调用时�Q�它�Ҏ��一个系�l�变量来军_��具体使用哪一个解析器。又因�ؓ所有的解析器都服从于JAXP所定义的接口，所以无论具体��用哪一个解析器�Q�代码都是一��L��。所以当在不同的解析器之间进行切换时�Q�只需要更改系�l�变量的��|��而不用更改�Q何代码。这��是工厂所带来的好处。这个工厂模式的具体实现�Q�可以参看下面的�c�d��。�?br />

CODE:


DocumentBuilder db = dbf.newDocumentBuilder();

当获得一个工厂对象后�Q��用它的静态方法newDocumentBuilder()�Ҏ��可以获得一个DocumentBuilder对象�Q�这个对象代表了具体的DOM解析器。但具体是哪一�U�解析器�Q�微软的或者IBM的，对于�E�序而言�q�不重要。�?br />
然后�Q�我们就可以利用�q�个解析器来对XML文档�q�行解析了：

CODE:


Document doc = db.parse("c:/xml/message.xml");

DocumentBuilder的parse()�Ҏ��接受一个XML文档名作��入参敎ͼ��q�回一个Document对象�Q�这个Document对象��׃��表了一个XML文档的树模型。以后所有的对XML文档的操作，都与解析器无养I��直接在这个Document对象上进行操作就可以了。而具体对Document操作的方法，��是由DOM所定义的了。�?br />

Jaxp支持W3C所推荐的DOM 2。如果你对DOM很熟悉，那么下面的内容就很简单了�Q�只需要按照DOM的规范来�q�行�Ҏ��调用��可以。当�Ӟ��如果你对DOM不清楚，也不用着急，后面我们会有详细的介�l�。在�q�儿�Q�你所要知道�ƈ牢记的是�Q�DOM是用来描叙XML文档中的数据的模型，引入DOM的全部原因就是�ؓ了用�q�个模型来操作XML文档的中的数据。DOM规范中定义有节点�Q�即对象�Q�、属性和�Ҏ��Q�我们通过�q�些节点的存取来存取XML的数据。�?br />
从上面得到的Document对象开始，我们��可以开始我们的DOM之旅了。��用Document对象的getElementsByTagName()�Ҏ��Q�我们可以得��C��个NodeList对象�Q�一个Node对象代表了一个XML文档中的一个标�{�օ�素，而NodeList对象�Q�观其名而知其意�Q�所代表的是一个Node对象的列表：

CODE:


NodeList nl = doc.getElementsByTagName("message");

我们通过�q�样一条语句所得到的是XML文档中所�?lt;message>标签对应的Node对象的一个列表。然后，我们可以使用NodeList对象的item()�Ҏ��来得到列表中的每一个Node对象�Q��?br />

CODE:


Node my_node = nl.item(0);

当一个Node对象被徏立之后，保存在XML文档中的数据��p��提取出来�q�封装在�q�个Node中了。在�q�个例子中，要提取Message标签内的内容�Q�我们通常会��用Node对象的getNodeValue()�Ҏ��Q��?br />

CODE:


String message = my_node.getFirstChild().getNodeValue();

��h��意，�q�里�q��用了一个getFirstChild()�Ҏ��来获得message下面的第一个子Node对象。虽然在message标签下面除了文本外�ƈ没有其它子标�{�或者属性，但是我们坚持在这里��用getFirseChild()�Ҏ��Q�这主要和W3C对DOM的定义有兟뀂W3C把标�{�ֆ�的文本部分也定义成一个Node�Q�所以先要得��C��表文本的那个Node�Q�我们才能够使用getNodeValue()来获取文本的内容。�?br />
现在�Q�既然我们已�l�能够从XML文�g中提取出数据了，我们��可以把�q�些数据用在合适的地方�Q�来构筑应用�E�序。�?br />
下面的内容，我们��更多的��x��DOM�Q��ؓDOM作一个较��l�的解析�Q��我们使用��h��更�ؓ得心应手。�?br />
DOM详解
1�Q�基本的DOM对象

DOM的基本对象有5个：Document�Q�Node�Q�NodeList�Q�Element和Attr。下面就�q�些对象的功能和实现的方法作一个大致的介绍。�?br />
Document对象代表了整个XML的文档，所有其它的Node�Q�都以一定的��序包含在Document对象之内�Q�排列成一个树形的�l�构�Q�程序员可以通过遍历�q�颗树来得到XML文档的所有的内容�Q�这也是对XML文档操作的�v炏V��我们��L��先通过解析XML源文件而得��C��个Document对象�Q�然后再来执行后�l�的操作。此外，Document�q�包含了创徏其它节点的方法，比如createAttribut()用来创徏一个Attr对象。它所包含的主要的�Ҏ��有：

createAttribute(String)�Q�用�l�定的属性名创徏一个Attr对象�Q��ƈ可在其后使用setAttributeNode�Ҏ��来放�|�在某一个Element对象上面。�?br />
createElement(String)�Q�用�l�定的标�{�֐�创徏一个Element对象�Q�代表XML文档中的一个标�{�，然后��可以在�q�个Element对象上添加属性或�q�行其它的操作。�?br />
createTextNode(String)�Q�用�l�定的字�W�串创徏一个Text对象�Q�Text对象代表了标�{�或者属性中所包含的纯文本字符丌Ӏ�如果在一个标�{�ֆ�没有其它的标�{�，那么标签内的文本所代表的Text对象是这个Element对象的唯一子对象。�?br />
getElementsByTagName(String)�Q�返回一个NodeList对象�Q�它包含了所有给定标�{�֐�字的标签。�?br />
getDocumentElement()�Q�返回一个代表这个DOM树的根节点的Element对象�Q�也��是代表XML文档根元素的那个对象。�?br />
Node对象是DOM�l�构中最为基本的对象�Q�代表了文档树中的一个抽象的节点。在实际使用的时候，很少会真正的用到Node�q�个对象�Q�而是用到诸如Element、Attr、Text�{�Node对象的子对象来操作文档。Node对象��些对象提供了一个抽象的、公��q��栏V��虽然在Node对象中定义了对其子节点进行存取的�Ҏ��Q�但是有一些Node子对象，比如Text对象�Q�它�q�不存在子节点，�q�一�Ҏ��要注意的。Node对象所包含的主要的�Ҏ��有：

appendChild(org.w3c.dom.Node)�Q��ؓ�q�个节点��d��一个子节点�Q��ƈ攑֜�所有子节点的最后，如果�q�个子节点已�l�存在，则先把它删掉再添加进厅R��?br />
getFirstChild()�Q�如果节点存在子节点�Q�则�q�回�W�一个子节点�Q�对�{�的�Q�还有getLastChild()�Ҏ��q�回最后一个子节点。�?br />
getNextSibling()�Q�返回在DOM树中�q�个节点的下一个兄弟节点，对等的，�q�有getPreviousSibling()�Ҏ��q�回其前一个兄弟节炏V��?br />
getNodeName()�Q�根据节点的�c�d��q�回节点的名�U�。�?br />
getNodeType()�Q�返回节点的�c�d��。�?br />
getNodeValue()�Q�返回节点的倹{��?br />
hasChildNodes()�Q�判断是不是存在有子节点。�?br />
hasAttributes()�Q�判断这个节�Ҏ��否存在有属性。�?br />
getOwnerDocument()�Q�返回节�Ҏ��处的Document对象。�?br />
insertBefore(org.w3c.dom.Node new�Q�org.w3c.dom.Node ref)�Q�在�l�定的一个子对象前再插入一个子对象。�?br />
removeChild(org.w3c.dom.Node)�Q�删除给定的子节点对象。�?br />
replaceChild(org.w3c.dom.Node new�Q�org.w3c.dom.Node old)�Q�用一个新的Node对象代替�l�定的子节点对象。�?br />
NodeList对象�Q�顾名思义�Q�就是代表了一个包含了一个或者多个Node的列表。可以简单的把它看成一个Node的数�l�，我们可以通过�Ҏ��来获得列表中的元素：

GetLength()�Q�返回列表的长度。�?br />
Item(int)�Q�返回指定位�|�的Node对象。�?br />
Element对象代表的是XML文档中的标签元素�Q��承于Node�Q�亦是Node的最主要的子对象。在标签中可以包含有属性，因而Element对象中有存取其属性的�Ҏ��Q�而�Q何Node中定义的�Ҏ��Q�也可以用在Element对象上面。�?br />
getElementsByTagName(String)�Q�返回一个NodeList对象�Q�它包含了在�q�个标签中其下的子孙节点中具有给定标�{�֐�字的标签。�?br />
getTagName()�Q�返回一个代表这个标�{�֐�字的字符丌Ӏ��?br />
getAttribute(String)�Q�返回标�{�中�l�定属性名�U�的属性的倹{��在�q�儿需要主要的是，应�ؓXML文档中允许有实体属性出玎ͼ�而这个方法对�q�些实体属性�ƈ不适用。这时候需要用到getAttributeNodes()�Ҏ��来得��C��个Attr对象来进行进一步的操作。�?br />
getAttributeNode(String)�Q�返回一个代表给定属性名�U�的Attr对象。�?br />
Attr对象代表了某个标�{�中的属性。Attr�l�承于Node�Q�但是因为Attr实际上是包含在Element中的�Q�它�q�不能被看作是Element的子对象�Q�因而在DOM中Attr�q�不是DOM树的一部分�Q�所以Node中的getparentNode()�Q�getpreviousSibling()和getnextSibling()�q�回的都��是null。也��是��_��Attr其实是被看作包含它的Element对象的一部分�Q�它�q�不作�ؓDOM树中单独的一个节点出现。这一点在使用的时候要同其它的Node子对象相区别。�?br />
需要说明的是，上面所说的DOM对象在DOM中都是用接口定义的，在定义的时候��用的是与具体语言无关的IDL语言来定义的。因而，DOM其实可以在�Q何面向对象的语言中实玎ͼ�只要它实��C��DOM所定义的接口和功能��可以了。同�Ӟ��有些�Ҏ��在DOM中�ƈ没有定义�Q�是用IDL的属性来表达的，当被映射到具体的语言�Ӟ��q�些属性被映射为相应的�Ҏ��。�?br />
2�Q�DOM实例

有了上面的介�l�，�怿�你对DOM理解的更多了吧。下面的例子��让你对DOM更加熟悉��h��。�?br />
先说说这个例子到底要做的是什么吧�Q�我们希望在一个名为link.xml文�g中保存了一些URL地址�Q�通过一个简单的�E�序�Q�我们可以通过DOM把这些URL��d��q�显�C�出来，也可以反�q�来向这个XML文�g中写入加入的URL地址。很��单，却很实用�Q�也��_��来例�C�DOM的绝大部分用法了。�?br />
XML文�g本��n不复杂，��׃��l�出它的DTD了。link.xml:

CODE:





JSP Insider
http://www.jspinsider.com
JSP Insider

2
1
2001

A JSP information site.


The makers of Java
http://java.sun.com
Sun Microsystems

3
1
2001

Sun Microsystem's website.


The standard JSP container
http://jakarta.apache.org
Apache Group

4
1
2001

Some great software.

�W�一个程序我们称为xmldisplay.java�Q�具体的�E�序清单可以在附件中扑ֈ�。主要的功能��是��d��q�个XML文�g中各个节点的内容�Q�然后在格式化输出在System.out上，我们来看看这个程序：

CODE:


import javax.xml.parsers.*;
import org.w3c.dom.*;

�q�是引入必要的类�Q�因为在�q�里使用的是Sun所提供的XML解析器，因而需要引入java.xml.parsers包，其中包含了有DOM解析器和SAX解析器的具体实现。org.w3c.dom包中定义了w3c所制定的DOM接口。�?br />

CODE:


DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder=factory.newDocumentBuilder();
Document doc=builder.parse("links.xml");
doc.normalize();

除了上面讲到的，�q�有一个小技巧，对Document对象调用normalize()�Q�可以去掉XML文档中作为格式化内容的空白而映��在DOM树中的不必要的Text Node对象。否则你得到的DOM树可能�ƈ不如你所惌��的那栗��特别是在输出的时候，�q�个normalize()更�ؓ有用。�?br />

CODE:


NodeList links =doc.getElementsByTagName("link");

刚才说过�Q�XML文档中的�I�白�W�也会被作�ؓ对象映射在DOM树中。因而，直接调用Node�Ҏ��的getChildNodes�Ҏ��有时候会有些问题�Q�有时不能够�q�回所期望的NodeList对象。解决的办法是��用Element的getElementByTagName(String)�Q�返回的NodeLise��是所期待的对象了。然后，可以用item()�Ҏ��提取惌��的元素。�?br />

CODE:


for (int i=0;iElement link=(Element) links.item(i);
System.out.print("Content: ");
System.out.println(link.getElementsByTagName("text").item(0).getFirstChild().getNodeValue());
System.out.print("URL: ");
System.out.println(link.getElementsByTagName("url").item(0).getFirstChild().getNodeValue());
System.out.print("Author: ");
System.out.println(link.getElementsByTagName("author").item(0).getFirstChild().getNodeValue());
System.out.print("Date: ");
Element linkdate=(Element) link.getElementsByTagName("date").item(0);
String day=linkdate.getElementsByTagName("day").item(0).getFirstChild().getNodeValue();
String month=linkdate.getElementsByTagName("month").item(0).getFirstChild().getNodeValue();
String year=linkdate.getElementsByTagName("year").item(0).getFirstChild().getNodeValue();
System.out.println(day+"-"+month+"-"+year);
System.out.print("Description: ");
System.out.println(link.getElementsByTagName("description").item(0).getFirstChild().getNodeValue());
System.out.println();
}

上面的代码片断就完成了对XML文档内容的格式化输出。只要注意到一些细节的问题�Q�比如getFirstChile()�Ҏ��和getElementsByTagName()�Ҏ��的��用，�q�些�q�是比较�Ҏ��的。�?br />
下面的内容，��是在修改了DOM树后重新写入到XML文档中去的问题了。这个程序名为xmlwrite.java。在JAXP1.0版本中，�q�没有直接的�c�d��Ҏ��能够处理XML文档的写入问题，需要借助其它包中的一些辅助类。而在JAXP1.1版本中，引入了对XSLT的支持，所谓XSLT�Q�就是对XML文档�q�行变换�Q�Translation�Q�后�Q�得��C��个新的文档结构。利用这个新加入的功能，我们��p��够很方便的把新生成或者修改后的DOM树从新写回到XML文�g中去了，下面我们来看看代码的实现�Q�这�D�代码的主要功能是向links.xml文�g中加入一个新的link节点�Q��?br />

CODE:


import javax.xml.parsers.*;
import javax.xml.transform.*;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.w3c.dom.*;

新引入的java.xml.transform包中的几个类�Q�就是用来处理XSLT变换的。�?br />
我们希望在上面的XML文�g中加入一个新的link节点�Q�因而首先还是要��d��links.xml文�g�Q�构��Z��个DOM树，然后再对�q�个DOM树进行修改（��d��节点�Q�，最后把修改后的DOM写回到links.xml文�g中：

CODE:


DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder=factory.newDocumentBuilder();
Document doc=builder.parse("links.xml");
doc.normalize();
//---取得变量----
String text="Hanzhong's Homepage";
String url="www.hzliu.com";
String author="Hzliu Liu";
String discription="A site from Hanzhong Liu, give u lots of suprise!!!";

��Z��看清重点�Q�简化程序，我们把要加入的内容硬�~�码到记忆String对象中，而实际操作中�Q�往往利用一个界面来提取用户输入�Q�或者通过JDBC从数据库中提取想要的内容。�?br />

CODE:


Text textseg;
Element link=doc.createElement("link");

首先应该明了的是�Q�无��Z��么类型的Node�Q�Text型的也好�Q�Attr型的也好�Q�Element型的也好�Q�它们的创徏都是通过Document对象中的createXXX()�Ҏ��来创建的�Q�XXX代表具体要创建的�c�d��Q�，因此�Q�我们要向XML文档中添加一个link��目�Q�首先要创徏一个link对象�Q��?br />

CODE:


Element linktext=doc.createElement("text");
textseg=doc.createTextNode(text);
linktext.appendChild(textseg);
link.appendChild(linktext);
Element linkurl=doc.createElement("url");
textseg=doc.createTextNode(url);
linkurl.appendChild(textseg);
link.appendChild(linkurl);
Element linkauthor=doc.createElement("author");
textseg=doc.createTextNode(author);
linkauthor.appendChild(textseg);
link.appendChild(linkauthor);
java.util.Calendar rightNow = java.util.Calendar.getInstance();
String day=Integer.toString(rightNow.get(java.util.Calendar.DAY_OF_MONTH));
String month=Integer.toString(rightNow.get(java.util.Calendar.MONTH));
String year=Integer.toString(rightNow.get(java.util.Calendar.YEAR));
Element linkdate=doc.createElement("date");
Element linkdateday=doc.createElement("day");
textseg=doc.createTextNode(day);
linkdateday.appendChild(textseg);
Element linkdatemonth=doc.createElement("month");
textseg=doc.createTextNode(month);
linkdatemonth.appendChild(textseg);
Element linkdateyear=doc.createElement("year");
textseg=doc.createTextNode(year);
linkdateyear.appendChild(textseg);
linkdate.appendChild(linkdateday);
linkdate.appendChild(linkdatemonth);
linkdate.appendChild(linkdateyear);
link.appendChild(linkdate);
Element linkdiscription=doc.createElement("description");
textseg=doc.createTextNode(discription);
linkdiscription.appendChild(textseg);
link.appendChild(linkdiscription);

创徏节点的过�E�可能有些千��一律，但需要注意的地方是，对Element中所包含的text�Q�在DOM中，�q�些text也是代表了一个Node的，因此也必��Mؓ它们创徏相应的node�Q�，不能直接用Element对象的setNodeValue()�Ҏ��来设�|�这些text的内容，而需要用创徏的Text对象的setNodeValue()�Ҏ��来设�|�文本，�q�样才能够把创徏的Element和其文本内容��d��到DOM树中。看看前面的代码�Q�你会更好的理解�q�一点：

CODE:


doc.getDocumentElement().appendChild(link);

最后，不要忘记把创建好的节�Ҏ��加到DOM树中。Document�cȝ��getDocumentElement()�Ҏ��Q�返回代表文档根节点的Element对象。在XML文档中，根节点一定是唯一的。�?br />

CODE:


TransformerFactory tFactory =TransformerFactory.newInstance();
Transformer transformer = tFactory.newTransformer();
DOMSource source = new DOMSource(doc);
StreamResult result = new StreamResult(new java.io.File("links.xml"));
transformer.transform(source, result);

然后��是用XSLT把DOM树输��Z��。这里的TransformerFactory也同样应用了工厂模式�Q��得具体的代码同具体的变换器无兟뀂实现的�Ҏ��和DocumentBuilderFactory相同�Q�这儿就不赘�q�C��。Transformer�cȝ��transfrom�Ҏ��接受两个参数、一个数据源Source和一个输出目标Result。这里分别��用的是DOMSource和StreamResult�Q�这样就能够把DOM的内容输出到一个输出流中，当这个输出流是一个文件的时候，DOM的内容就被写入到文�g中去了�?br />

vso 2006-10-12 16:50 发表评论

用JDOM处理XML文档

vso — Thu, 12 Oct 2006 08:48:00 GMT

关键词：Java、JDOM、XML、JAXB
�Ƣ迎与我讨论�Q�boyofjava@sina.com�Q?br />
�Q�一�Q�JDOM的介�l�以及与JAXB的比�?br />
Java + XML = JDOM �Q?br />�q�就是JDOM设计者的目标。如果你曄��使用�q�烦人的SAX或是DOM来处理XML�Q�你��׃��知道��Z��么要有JDOM或者是JAXB。在今年�Q?002�Q�的JavaOne会议上JDOM的主要创始�hJason Hunter有一��精彩的演讲介绍了JDOM技术，题目��是JDOM Makes XML Easy�?br />在那��文档里�Q�JDOM被拿来与DOM比较�Q�而我更愿意拿它同JAXB比较。因为JAXB和JDOM都是��Z��在Java中提供比DOM和SAX更�ؓ方便的XML处理接口而开发的�Q��ƈ且通过完全不同的途径来解册��个问题。JDOM的处理方式是与DOM�c�M��的树操作。而JAXB通过DTD和绑定模式来生成讉K��XML文档的Java代码�Q�将XML映射成了Java对象来操作。你可以�Ҏ��目的需要和个�h喜好来决定采用哪一个�?br />JDOM与JAXB的比较，从本�w�的特点来看�Q?br />1)    JDOM比JAXB更容易上手。��用JAXB首先要会�~�写DTD�Q�然后还要会�~�写�l�定模式。JDOM没有�q�样的要求，如果你会Java和XML�Q�甚臛_��以说光是看JDOM的javadoc文档��p��够��用JDOM�?br />2)    JAXB�~�写好DTD和绑定模式以后，XML文档被映��成了Java对象�Q�其数据��是Java对象的属性，�q�数据类型都做好了�{换，因此�Q�访问XML文档比JDOM要简便，可以说是一��x��逸�?br />3)    JAXB由某个DTD和绑定模式生成的代码只能讉K��该DTD所�U�束的文档。如果想要访问其他XML文档�Q�需要再�~�写DTD和绑定模式。JDOM可以处理��M��XML文档�Q�包括受�U�束的和不受�U�束的�?br />
目前JDOM和JAXB都没有正式版本。JDOM的最新版本是beta8�Q�JAXB�?.0 early access�Q�其规范版本�?.21。相对而言�Q�JDOM更成熟一些。例如JAXB不支持名字空间、不能向XML文档写入处理指��o�Q�有时我们需要保留的换行�W�和首尾�I�格在JAXB中自动过滤掉了，��p��攑֜�里面也不能幸免。JDOM��没有这些限制。如果说以上�?�Ҏ��较是JDOM和JAXB本��n的特�Ҏ��军_��的，几乎不可能改变，那么�q�里表明�Q�JAXB�q�需要更多的工作�?br />
�Q�二�Q�获得�ƈ安装JDOM
在http://jdom.org可以下蝲JDOM的最新版本。以JDOM beta8�?�q�制版本��Z��。下载后解压�~�，JDOM的jar文�g��是build目录下的文�gjdom.jar�Q�将之加入类路径。另外JDOM�q�需要lib目录下那些jar文�g如xerces.jar的支持。如果在使用中出��C��下错误：
java.lang.NoSuchMethodError
或�?br />java.lang.NoClassDefFoundError: org/xml/sax/SAXNotRecognizedException
你需要保证xerces.jar文�g在CLASSPATH中位于其他XML�c�，如JAXP或Crimson之前�Q�这些类文�g�Q�包括以前老版本的xerces�Q�可能不支持SAX2.0或DOM Level 2。于是导致了上面的错误�?br />
�Q�三�Q�一个简单的例子
JDOM的处理方式有些类��g��DOM�Q�但它主要是用SAX实现的，你不必担心处理速度和内存的问题。另外，JDOM中几乎没有接口，的类全部是实实在在的�c�，没有�c�d��厂类的。其最重要的一个包org.jdom中主要有以下�c�：
? Attribute
? CDATA
? Comment
? DocType
? Document
? Element
? EntityRef
? Namespace
? ProcessingInstruction
?    Text
数据输入要用到XML文档要通过org.jdom.input包，反过来需要org.jdom.output。如前面所��_��x��看API文档��p��够��用�?br />我们的例子读入XML文�gexampleA.xml�Q�加入一条处理指令，修改�W�一本书的�h格和作者，�q�添加一条属性，然后写入文�gexampleB.xml�Q?br />//exampleA.xml


        Java�~�程入门
        张三
        2002-6-6
        35.0


        XML在Java中的应用
        李四
        2002-9-16
        92.0


//testJDOM.java
import org.jdom.*;
import org.jdom.output.*;
import org.jdom.input.*;
import java.io.*;
public class TestJDOM{
    public static void main(String args[])throws Exception{

        SAXBuilder sb = new SAXBuilder();

        //从文件构造一个Document�Q�因为XML文�g中已�l�指定了�~�码�Q�所以这里不必了
        Document doc = sb.build(new FileInputStream("exampleA.xml"));

        //加入一条处理指令\
        ProcessingInstruction pi = new ProcessingInstruction
            ("xml-stylesheet","href=\"bookList.html.xsl\" type=\"text/xsl\"");
        doc.addContent(pi);

        Element root = doc.getRootElement(); //得到根元�?br />        java.util.List books = root.getChildren(); //得到根元素所有子元素的集�?br />        Element book = (Element)books.get(0); //得到�W�一个book元素
        //为第一本书��d��一条属�?br />        Attribute a = new Attribute("hot","true");
        book.setAttribute(a);
        Element author = book.getChild("author"); //得到指定的字元素
        author.setText("王五\\"); //��作者改为王�?br />        //或 Text t = new Text("王五\\");book.addContent(t);
        Element price = book.getChild("price"); //得到指定的字元素
        //修改��h��Q�比较郁��L��是我们必��自��p�{换数据类型，而这正是JAXB的优�?br />        author.setText(Float.toString(50.0f));


        String indent = "    ";
        boolean newLines = true;
        XMLOutputter outp = new XMLOutputter(indent,newLines,"GBK");
        outp.output(doc, new FileOutputStream("exampleB.xml"));

    }
};

执行�l�果exampleB.xml�Q?br />

            Java�~�程入门
        50.0
        2002-6-6
        35.0


        XML在Java中的应用
        李四
        2002-9-16
        92.0


在默认情况下�Q�JDOM的Element�cȝ��getText()�q�类的方法不会过滤空白字�W�，如果你需要过滤，用setTextTrim() �?br />

�Q�四�Q�参考文�?br />1)    JDOM Makes XML Easy (http://www.servlets.com/speaking/jdom-javaone.pdf)
2)    The Java ™ Architecture for XML Binding User’s Guide (http://java.sun.com/xml/jaxb/jaxb-docs.pdf)
3)    Web Services Made Easier. The Java TM APIs and Architectures for XML, A Technical White Paper (http://java.sun.com/xml/webservices.pdf )

vso 2006-10-12 16:48 发表评论

vso — Thu, 12 Oct 2006 08:47:00 GMT

本文��要的讨论了Java语言�~�程中更新XML文档的四�U�常用方�?�q�且分析�q�四�U�方法的优劣。其��?本文�q�对如何控制Java�E�序输出的XML文档的格式做了展开��。�?br />

JAXP是Java API for XML Processing的英文字头羃�?中文含义�?用于XML文档处理的��用Java语言�~�写的编�E�接口。JAXP支持DOM、SAX、XSLT�{�标准。�ؓ了增强JAXP使用上的灉|��?开发者特别�ؓJAXP设计了一个Pluggability Layer,在Pluggability Layer的支持之�?JAXP既可以和具体实现DOM API、SAX API 的各�U�XML解析�?XML Parser,例如Apache Xerces)联合工作,又可以和具体执行XSLT标准的XSLT处理�?XSLT Processor,例如Apache Xalan)联合工作。应用Pluggability Layer的好处在�?我们只需要熟悉JAXP各个�~�程接口的定义即�?而不需要对所采用的具体的XML解析器、XSLT处理器有很深入的了解。比如在某个Java�E�序�?通过JAXP调用XML解析器Apache Crimson对XML文档�q�行处理,如果我们希望使用别的XML解析�?比如Apache Xerces),以便提高该程序的性能,那么原程序代码可能不需要�Q何改�?直接��可以��?你所需要做的事情只是将包含Apache Xerces代码的jar文�g加入到环境变量CLASSPATH�?而将包含Apache Crimson代码的jar文�g在环境变量CLASSPATH中删�?。�?br />

目前JAXP已经应用的十分普遍了,可以说是Java语言中处理XML文档的标准API。有些初学者在学习使用JAXP的过�E�中,�l�常会提��L��问题:我编写的�E�序对DOM Tree做了更新,但是当程序退��Z��?原始的XML文档�q�没有改�?�q�是老样�?如何实现对原始XML文档和DOM Tree的同步更新呢?咋一看来,在JAXP中似乎没有提供相应的接口/�Ҏ��/�c?�q�是很多初学者都感到困惑的问题。本文的��L��在于解册��个问�?��单的介绍几种常用的同步更新原始XML文档和DOM Tree的方法。�ؓ了羃��讨论的范围,本文所涉及的XML解析器仅包括Apache Crimson和Apache Xerces,而XSLT处理器仅仅��用Apache Xalan。�?br />

�Ҏ��一:直接��d��XML文档

�q�也许是最�W�最原始的办法了。当�E�序获取DOM Tree之后,应用DOM模型的Node接口的各个方法对DOM Tree�q�行更新,下一步应该对原始的XML文档�q�行更新了。我们可以运用递归的办法或者是应用TreeWalker�c?遍历整个DOM Tree,与此同时,��DOM Tree的每一个节�?元素依次写入到预先打开的原始XML文档�?当DOM Tree被遍历完全之�?DOM Tree和原始的XML文档��实��C��同步更新。实际中,�q�个�Ҏ��极少使用,不过如果你要�~�程实现自己的XML解析�?�q�种�Ҏ��q�是有可能用得上的。�?br />

�Ҏ��?使用XmlDocument�c��?br />

使用XmlDocument�c?JAXP中分明没有这个类呀!是不是作者搞错了?没有�?��是使用XmlDocument�c?��切的说,是��用XmlDocument�cȝ��write()�Ҏ��。�?br />

在上文已�l�提到过,JAXP可以和各�U�各��L��XML解析器联合��?�q�次我们选用的XML解析器是Apache Crimson。XmlDocument(org.apache.crimson.tree.XmlDocument)是Apache Crimson的一个类,�q�不包含于标准的JAXP�?难怪在JAXP的文档中找不到XmlDocument�cȝ��芌��呢。现在问题出来了,如何应用XmlDocument�c�L��实现更新XML文档的功�?在XmlDocument�c�M��提供了下面三个write()�Ҏ��(�Ҏ��Crimson最新的版本------Apache Crimson 1.1.3):

public void write (OutputStream out) throws IOException

public void write (Writer out) throws IOException

public void write (Writer out, String encoding) throws IOException

上述三个write()�Ҏ��的主要作用就是输出DOM Tree中的内容到特定的输出介质�?比如文�g输出��、应用程序控制台�{�等。那么又如何使用上述三个write()�Ҏ��?��L��下面的Java�E�序代码片断:

String name="fancy";

DocumentBuilder parser;

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

try

{

parser = factory.newDocumentBuilder();

Document doc = parser.parse("user.xml");

Element newlink=doc.createElement(name);

doc.getDocumentElement().appendChild(newlink);

((XmlDocument)doc).write(new FileOutputStream(new File("xuser1.xml")));

}

catch (Exception e)

{

//to log it

}

在上面的代码�?首先创徏了一个Document对象doc,获取完整的DOM Tree,然后应用Node接口的appendChild()�Ҏ��,在DOM Tree的最后追加了一个新节点(fancy),最后调用XmlDocument�cȝ��write(OutputStream out)�Ҏ��,把DOM Tree中的内容输出到xuser.xml�?其实也可以输出到user.xml,更新原始的XML文档,在这里�ؓ了便于做�Ҏ��,故而输出到xuser.xml文�g�?。需要注意的是不能直接对Document对象doc直接调用write()�Ҏ��,因�ؓJAXP的Document接口�q�没有定义�Q何write()�Ҏ��,所以必��d��doc由Document对象强制转换为XmlDocument对象,然后才能调用write()�Ҏ��,在上面的代码中��用的是write(OutputStream out)�Ҏ��,�q�个�Ҏ��使用�~�省的UTF-8�~�码输出DOM Tree中的内容到特定的输出介质�?如果DOM Tree中包含中文字�W?那么输出的结果有可能是�ؕ�?亦即存在所谓的"汉字问题\\",解决的办法是使用write (Writer out, String encoding)�Ҏ��,昑ּ�指定输出时的�~�码,例如��第二个参数设�ؓ"GB2312",�q�时即不存在"汉字问题\\",输出�l�果能够正常昄��中文字符。�?br />

完整的例子请参考下列文�? AddRecord.java(见附�?、user.xml(见附�?。该例子的运行环境�ؓ:Windows XP Professional、JDK 1.3.1。�ؓ了能够正常编译运行AddRecord.java�q�个�E�序,你需要到�|�址http://xml.apache.org/dist/crimson/��M��载Apache Crimson,�q�将所获取的crimson.jar文�g加入到环境变量CLASSPATH中。�?br />

注意:

Apache Crimson的前�w�是Sun Project X Parser,后来不知何故,由X Parser演变为Apache Crimson,至今Apache Crimson的很多代码都是从X Parser中直接移植过来的。比如上文用到的XmlDocument�c?它在X Parser中是com.sun.xml.XmlDocument,��C��Apache Crimson中摇�w�一�?��变成了org.apache.crimson.tree.XmlDocument�c?其实它们的绝大部分代码是一��L��,可能��package语句和import语句以及文�g开头的一�D�lience有所不同而已。早期的JAXP是和X Parser捆绑在一��L��,因此一些老的�E�序使用了com.sun.xml�?如果你现在重新编译它�?有可能不能通过,肯定��是因�ؓ�q�个原因。后来的JAXP和Apache Crimson捆绑在一�?比如JAXP 1.1,如果你��用JAXP 1.1,那么不需要额外下载Apache Crimson,也能够正常编译运行上面的例子(AddRecord.java)。最新的JAXP 1.2 EA(Early Access)改��u更张,采用性能更好的Apache Xalan和Apache Xerces分别作�ؓXSLT处理器和XML解析�?不能直接支持Apache Crimson�?所以如果你的开发环境采用了JAXP 1.2 EA或者是Java XML Pack(内含JAXP 1.2 EA),那么��无法直接编译运行上面的例子(AddRecord.java),你需要额外下载�ƈ安装Apache Crimson。�?br />

�Ҏ��?使用TransformerFactory和Transformer�c��?br />

在JAXP中所提供的标准的更新原始XML文档的方法就是调用XSLT引擎,亦即使用TransformerFactory和Transformer�c�R��请看下面的Java代码片断:

//首先创徏一个DOMSource对象,该构造函数的参数可以是一个Document对象

//doc代表更改后的DOM Tree。�?br />
DOMSource doms = new DOMSource (doc);

//创徏一个File对象,代表DOM Tree所包含的数据的输出介质,�q�是一个XML文�g。�?br />
File f = new File ("XMLOutput.xml");

//创徏一个StreamResult对象,该构造函数的参数可以取�ؓFile对象。�?br />
StreamResult sr = new StreamResult (f);

//下面调用JAXP中的XSLT引擎来实现输出DOM Tree中的数据到XML文�g中的功能。�?br />
//XSLT引擎的输入�ؓDOMSource对象,输出为StreamResut对象。�?br />
try

{

//首先创徏一个TransformerFactory对象,再由此创建Transformer对象。Transformer

//�cȝ��当于一个XSLT引擎。通常我们使用它来处理XSL文�g,但是在这里我们��

//用它来输出XML文档。�?br />
TransformerFactory tf=TransformerFactory.newInstance();

Transformer t=tf.newTransformer ();

//关键的一�? 调用Transformer对象 (XSLT引擎)的transform()�Ҏ��,该方法的�W�一

//个参数是DOMSource对象,�W�二个参数是StreamResult对象。�?br />
t.transform(doms,sr);

}

catch (TransformerConfigurationException tce)

{

System.out.println("Transformer Configuration Exception
-----");

tce.printStackTrace();

}

catch (TransformerException te)

{

System.out.println ("Transformer Exception
---------");

te.printStackTrace ();

}

在实际的应用�?我们可以应用传统的DOM API从XML文档中获取DOM Tree,然后�Ҏ��实际的需求对DOM Tree执行各种操作,得到最�l�的Document对象,接下来可以由此Document对象创徏DOMSource对象,剩下的事情就是照搬上面的代码�?�E�序�q�行完毕�? XMLOutput.xml��是你所需要的�l�果(当然�?你可以随意更改StreamResult�c�L��造函数的参数,指定不同的输��Z��?而不必是千篇一律的XML文档)。�?br />

�q�个�Ҏ��最大的好处在于可以随心所�Ʋ的控制DOM Tree中的内容输出到输��Z��质中的格�?但是光靠TransformerFactory�c�d��Transformer�c�dƈ不能实现�q�个功能,�q�需要依赖OutputKeys�cȝ��帮助。完整的例子请参考下列文�? AddRecord2.java(见附�?、user.xml(见附�?。该例子的运行环境�ؓ:Windows XP Professional、JDK 1.3.1。�ؓ了能够正常编译运行AddRecord2.java�q�个�E�序,你需要到�|�址http://java.sun.com��M��载安装JAXP 1.1或者Java XML Pack(Java XML Pack已经内含JAXP�?。�?br />

OutputKeys�c��?br />

javax.xml.transform.OutputKeys�c�d��java.util.Properties�c�配合��?可以控制JAXP的XSLT引擎(Transformer�c?输出XML文档的格式。请看下面的代码片断:

//首先创徏一个TransformerFactory对象,再由此创建Transformer对象。�?br />
TransformerFactory tf=TransformerFactory.newInstance();

Transformer t=tf.newTransformer ();

//获取Transformser对象的输出属�?亦即XSLT引擎的缺省输出属�?�q�是一个�?br />
//java.util.Properties对象。�?br />
Properties properties = t.getOutputProperties();

//讄��新的输出属�?输出字符�~�码为GB2312,�q�样可以支持中文字符,XSLT引擎所输出

//的XML文档如果包含了中文字�W?可以正常昄��,不会出现所谓的"汉字问题\\"。�?br />
//��L��意OutputKeys�cȝ��字符串常数OutputKeys.ENCODING。�?br />
properties.setProperty(OutputKeys.ENCODING,"GB2312");

/更新XSLT引擎的输出属性。�?br />
t.setOutputProperties(properties);

//调用XSLT引擎,按照输出属性中的设�|?输出DOM Tree中的内容到输��Z��质中。�?br />
t.transform(DOMSource_Object,StreamResult_Object);

从上面的�E�序代码,我们不难看出,通过讄��XSLT引擎(Transformer�c?的输出属�?可以控制DOM Tree中的内容的输出格�?�q�对于我们定制输出内�Ҏ��很有帮助的。那么JAXP的XSLT引擎(Transformer�c?有那些输出属性可以设�|�呢? javax.xml.transform.OutputKeys�c�d��义了很多字符串常�?它们都是可以自由讄��的输出属�?常用的输出属性如下所�C?

public static final java.lang.String METHOD

可以设�ؓ"xml"�?html"�?text"�{�倹{��?br />

public static final java.lang.String VERSION

所遵��@规范的版本号,如果METHOD设�ؓ"xml",那么它的值应该设�?1.0",如果METHOD设�ؓ"html",那么它的值应该设�?4.0",如果METHOD设�ؓ"text",那么�q�个输出属性会被忽略。�?br />

public static final java.lang.String ENCODING

讄��输出时所采用的编码方�?比如\\"GB2312"�?UTF-8"�{�等,如果��其讄��?GB2312",可以解决所谓的"汉字问题\\"。�?br />

public static final java.lang.String OMIT_XML_DECLARATION

讄��输出到XML文档中时是否忽略XML声明,亦即�c�M��?

�q�样的代码。它可选的值有"yes"�?no"。�?br />

public static final java.lang.String INDENT

IDENT讑֮�XSLT引擎在输出XML文档�?是否自动��d��额外的空�?它可选的��gؓ"yes"�?no"。�?br />

public static final java.lang.String MEDIA_TYPE

MEDIA_TYPE讑֮�输出文档的MIME�c�d��。�?br />

如果讑֮�XSLT引擎的输出属性呢?下面我们来�ȝ��一�?

首先是获取XSLT引擎(Transformer�c?的缺省输出属性的集合,�q�需要��用Transformer�cȝ��getOutputProperties()�Ҏ��,�q�回值是一个java.util.Properties对象。�?br />

Properties properties = transformer.getOutputProperties();

然后是设定新的输出属�?比如:

properties.setProperty(OutputKeys.ENCODING,"GB2312");

properties.setProperty(OutputKeys.METHOD,"html");

properties.setProperty(OutputKeys.VERSION,"4.0");

………………………………………………………�?br />

最后是更新XSLT引擎(Transformer�c?的缺省输出属性的集合,�q�需要��用Transformer�cȝ��setOutputProperties()�Ҏ��,参数是一个java.util.Properties对象。�?br />

我们�~�写了一个新的程�?其中应用了OutputKeys�c?用以控制XSLT引擎的输出属�?该程序的架构和前一个程�?AddRecord3.java)大致相同,不过输出�l�果略有不同。完整的代码请参考下列文�? AddRecord3.java(见附�?、user.xml(见附�?。该例子的运行环境�ؓ:Windows XP Professional、JDK 1.3.1。�ؓ了能够正常编译运行AddRecord3.java�q�个�E�序,你需要到�|�址http://java.sun.com��M��载安装JAXP 1.1或者Java XML Pack(Java XML Pack内含JAXP�?。�?br />

�Ҏ��?使用Xalan XML Serializer

�Ҏ��四其实是�Ҏ��三的一个变�U?它需要Apache Xalan和Apache Xerces的支持才能够�q�行。例子代码如下所�C?

//首先创徏一个DOMSource对象,该构造函数的参数可以是一个Document对象

//doc代表更改后的DOM Tree。�?br />
DOMSource domSource = new DOMSource (doc);

//创徏一个DOMResult对象,临时保存XSLT引擎的输出结果。�?br />
DOMResult domResult = new DOMResult();

//下面调用JAXP中的XSLT引擎来实现输出DOM Tree中的数据到XML文�g中的功能。�?br />
//XSLT引擎的输入�ؓDOMSource对象,输出为DOMResut对象。�?br />
try

{

//首先创徏一个TransformerFactory对象,再由此创建Transformer对象。Transformer

//�cȝ��当于一个XSLT引擎。通常我们使用它来处理XSL文�g,但是在这里我们��

//用它来输出XML文档。�?br />
TransformerFactory tf=TransformerFactory.newInstance();

Transformer t=tf.newTransformer ();

//讄��XSLT引擎的属�?必不可少,否则会��生\\"汉字问题\\")。�?br />
Properties properties = t.getOutputProperties();

properties.setProperty(OutputKeys.ENCODING,"GB2312");

t.setOutputProperties(properties);

//关键的一�? 调用Transformer对象 (XSLT引擎)的transform()�Ҏ��,该方法的�W�一

//个参数是DOMSource对象,�W�二个参数是DOMResult对象。�?br />
t.transform(domSource,domResult);

//创徏�~�省的Xalan XML Serializer,使用它将临时存放在DOMResult对象

//(domResult)中的内容以输出流的�Ş式输出到输出介质中。�?br />
Serializer serializer = SerializerFactory.getSerializer

(OutputProperties.getDefaultMethodProperties("xml"));

//讄��Xalan XML Serializer的输出属�?�q�一步必不可��?否则也可能��生�?br />
//所谓的"汉字问题\\"。�?br />
Properties prop=serializer.getOutputFormat();

prop.setProperty("encoding","GB2312");

serializer.setOutputFormat(prop);

//创徏一个File对象,代表DOM Tree所包含的数据的输出介质,�q�是一个XML文�g。�?br />
File f = new File ("xuser3.xml");

//创徏文�g输出��对象fos,��L��意构造函数的参数。�?br />
FileOutputStream fos=new FileOutputStream(f);

//讄��Xalan XML Serializer的输出流。�?br />
serializer.setOutputStream(fos);

//串行化输出结果。�?br />
serializer.asDOMSerializer().serialize(domResult.getNode());

}

catch (Exception tce)

{

tce.printStackTrace();

}

�q�个�Ҏ��不太常用,而且��g��有点画蛇添��,所以我们就不展开讨论了。完整的例子请参考下列文�? AddRecord4.java(见附�?、user.xml(见附�?。该例子的运行环境�ؓ:Windows XP Professional、JDK 1.3.1。�ؓ了能够正常编译运行AddRecord4.java�q�个�E�序,你需要到�|�址http://xml.apache.org/dist/��M��载安装Apache Xalan和Apache Xerces。�?br />

或者是到网址http://java.sun.com/xml/download.html��M��载安装Java XML Pack。因为最新的Java XML Pack(Winter 01 �?包含了Apache Xalan和Apache Xerces技术在内。�?br />

�l�论:

本文��略的讨论了Java语言�~�程中更新XML文档的四�U�方法。第一�U�方法是直接��d��XML文�g,�q�种�Ҏ��十分�J�琐,而且比较�Ҏ��出错,极少使用,除非你需要开发自��q��XML Parser,否则不会使用�q�种�Ҏ��。第二种�Ҏ��是��用Apache Crimson的XmlDocument�c?�q�种�Ҏ��极�ؓ��?使用方便,如果你选用Apache Crimson作�ؓXML解析�?那么不妨使用�q�种�Ҏ��,不过�q�种�Ҏ��g��效率不高(源于效率低下的Apache Crimson),另外,高版本的JAXP或者是Java XML Pack、JWSDP不直接支持Apache Crimson,亦即�q�种�Ҏ��不通用。第三种�Ҏ��是��用JAXP的XSLT引擎(Transformer�c?来输出XML文档,�q�种�Ҏ��也许是标准的�Ҏ��?使用��h��十分灉|��,特别是可以自如控制输出格�?我们推荐采用�q�种�Ҏ��。第四种�Ҏ��是第三种�Ҏ��的变�U?采用了Xalan XML Serializer,引入了串行化操作,对于大量文档的修�?输出有优��?可惜的是要重复设�|�XSLT引擎的属性和XML Serializer的输出属�?比较�ȝ��,而且依赖于Apache Xalan和Apache Xerces技�?通用性略显不��뀂�?br />

除了上面讨论的四�U�方法以�?实际上应用别的API(比如JDOM、Castor、XML4J、Oracle XML Parser V2)也有很多办法可以更新XML文档,限于��幅,在这里就不一一讨论了。�?br />

参考文献以及资料来�?

[1]The Java Web Services Tutorial, Sun Microsystems Inc.

[2]http://xml.apache.org,Apache XML Project(Crimson、Xerces、Xalan)

[3]http://www.jguru.com,XML Forum

[4]http://forum.java.sun.com,Java Technology & XML Forum

vso 2006-10-12 16:47 发表评论