??xml version="1.0" encoding="utf-8" standalone="yes"?>
XML是现代程序中一个必不可的l成部分Q也是世界上发展最快的技术之一。它的主要目的是以结构化的方式来表示数据Q在某些斚wQXML也类g数据库,提供数据的结构化视图?br />
XMLQ可扩展标记语言Q是从称为SGMLQ标准通用标记语言Q发展而来的,SGML的主要目的是定义使用标签来表C数据的标记语言的语法。基于SGML的重要语a之一是著名的HTML.
标签由包围在一个小于号<和一个大于号>之间的文本组?起始标签(tag)表示一个特定区域的开?例如<start>;l束标签定义了一个区域的l束,除了在小于号之后紧跟一个斜U外和v始标{一?例如</end>.举例说明标签如下:
<member id=“007”>邦d</member>?左边?lt;member id=“007”>是v始标{?邦d是标{中的文?007是属性Attribute, </member >是结束标{?
XML的发?/strong>
׃SGML中存在特D而随意的语法(如标{非嵌套?,使得建立一个SGML语言的解析器成了一艰巨的d,q些困难D了SGML一直停步不?
XML通过相对严格的语法规定得徏立一个XML解析器要Ҏ得多,q些语法包括:
1QQ何v始标{N必须有一个结束标{?br />
2Q可以采用另一U简化语法,可以在一个标{中同时表示起始和结束标{。这U语法是在大于符号前紧跟一个斜U?.?lt;tag />{同?lt;tag></tag>.
3Q标{ֿL照合适的序q行嵌套Q在没有关闭内部节点之前不能关闭外部节点?br />
4Q所有的Ҏ都必须有|Ҏ的值周围应该加上双引号?/p>
XML文档CZ
<?xml version="1.0" encoding="GBK"?>
<members>
<member name="Andy">
<age>25</age>
<title>JSE</title>
</member>
<member name="Bill">
<age>35</age>
<title>SSE</title>
</member>
<member name="Cindy">
<age>45</age>
<title>PM</title>
</member>
<member name="Douglas">
<age>45</age>
<title>GM</title>
</member>
</members>
<?xml version=“1.0” encoding=“GBK”?>是XML序言Q这一行代码告诉解析器文g按XML规则q行解析Q?GBK制定了此文g的编码方式?br /> <members>是文档的根节点,一个XML中有且只有一个根节点Q否则会造成解析p|?br /> <member name=“Andy”>。。?lt;/member>是根节点下面的子节点Qname是其Ҏ,Ҏ的gؓAndy。这个子节点下面有age和title两个子节炏V?/p>
XML的用?/strong>
以文本的形式存储数据,q样的Ş式适于机器阅读,对于人阅M相对方便.
作ؓE序的配|文件?如著名的web.xml,struts-config.xml
AjaxE序传递数据的载体.
WebService,SOAP的基.
针对XML的API
XML定义ZU语a之后Q就出现了用常见的~程语言Q如JavaQ来同时表现和处理XML代码的需求?/p>
首先出现的是Java上的SAXQSimple API for XMLQ项目。SAX提供了一个基于事件的XML解析的API。从其本质上来说QSAX解析器从文g的开头出发,从前向后解析Q每当遇到v始标{或者结束标{、特性、文本或者其他的XML语法Ӟ׃触发一个事件。然后,当事件发生时Q具体要怎么做就由开发h员决定?/p>
因ؓSAX解析器仅仅按照文本的方式来解析它们,所以SAX更轻量、更快速。而它们的主要~点是在解析中无法停止、后退或者不从文件开始,直接讉KXMLl构中的指定部分?/p>
DOM是针对XML的基于树的API。它x的不仅仅是解析XML代码Q而是使用一pd互相兌的对象来表示q些代码Q而这些对象可以被修改且无需重新解析代码p直接讉K它们?/p>
使用DOMQ只需解析代码一ơ来创徏一个树的模型;某些时候会使用SAX解析器来完成它。在q个初始解析q程之后QXML已经完全通过DOM模型来表现出来,同时也不再需要原始的代码。尽DOM比SAX慢很多,而且Q因为创Z相当多的对象而需要更多的开销Q但׃它用上的简便,因而成为Web览器和JavaScript最喜欢的方法?/p>
最方便的XML解析利器-dom4j
Dom4j是一个易用的、开源的库,用于XMLQXPath和XSLT。它应用于Javaq_Q采用了Java集合框架q完全支持DOMQSAX和JAXP.
sax和dom本n的api都比较复?不易使用,而开源包dom4j却综合了二者的优点,屏蔽了晦涩的l节,装了一pdcd接口以方便用户用它来读写XML.
Dom4j下蝲
要用dom4jdXML文档,需要先下蝲dom4j?dom4j官方|站?http://www.dom4j.org/ 目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip
解开后有两个?仅操作XML文档的话把dom4j-1.6.1.jar加入工程可以了,如果需要用XPath的话q需要加入包jaxen-1.1-beta-7.jar.
使用dom4jdxml的一些常用对?/strong>
1.Document:文档对象,它代表着整篇xml文档.
2.Element:节点元素,它代表着xml文档中的一个节点元?如前面的<age>25</age>是一个Element.其?文本??5.
3.Attribute:节点属?如前面的节点元素<member name=“Andy”>…< /member >? name是节点元素的一个属?其?文本?为Andy.
与Document对象相关的API
1.dXML文g,获得document对象.
SAXReader reader = new SAXReader();
Document document = reader.read(new File("input.xml"));
2.解析XML形式的文?得到document对象.
String text = "<members></members>";
Document document = DocumentHelper.parseText(text);
3.d创徏document对象.
Document document = DocumentHelper.createDocument();
Element root = document.addElement("members");// 创徏根节?/p>
与Element有关的API
1.获取文档的根节点.
Element rootElm = document.getRootElement();
2.取得某节点的单个子节?
Element memberElm=root.element(“member”);// “member”是节点名
3.取得节点的文?br />
String text=memberElm.getText();
也可以用:
String text=root.elementText("name");q个是取得根节点下的name字节点的文字.
4.取得某节点下名ؓ"member"的所有字节点q进行遍?
List nodes = rootElm.elements("member");
for (Iterator it = nodes.iterator(); it.hasNext();) {
Element elm = (Element) it.next();
// do something
}
5.Ҏ节点下的所有子节点q行遍历.
for(Iterator it=root.elementIterator();it.hasNext();){
Element element = (Element) it.next();
// do something
}
6.在某节点下添加子节点.
Element ageElm = newMemberElm.addElement("age");
7.讄节点文字.
ageElm.setText("29");
8.删除某节?
parentElm.remove(childElm);// childElm是待删除的节?parentElm是其父节?/p>
与Attribute相关的API
1.取得某节点下的某属?br />
Element root=document.getRootElement();
Attribute attribute=root.attribute("size");// 属性名name
2.取得属性的文字
String text=attribute.getText();
也可以用:
String text2=root.element("name").attributeValue("firstname");q个是取得根节点下name字节点的属性firstname的?
3.遍历某节点的所有属?br />
Element root=document.getRootElement();
for(Iterator it=root.attributeIterator();it.hasNext();){
Attribute attribute = (Attribute) it.next();
String text=attribute.getText();
System.out.println(text);
}
4.讄某节点的属性和文字.
newMemberElm.addAttribute("name", "sitinspring");
5.讄属性的文字
Attribute attribute=root.attribute("name");
attribute.setText("sitinspring");
6.删除某属?br />
Attribute attribute=root.attribute("size");// 属性名name
root.remove(attribute);
document的内容写入XML文g
1.文档中全?不设|编?直接写入的Ş?
XMLWriter writer = new XMLWriter(new FileWriter("output.xml"));
writer.write(document);
writer.close();
2.文档中含有中?讄~码格式写入的Ş?
OutputFormat format = OutputFormat.createPrettyPrint();
format.setEncoding("GBK"); // 指定XML~码
XMLWriter writer = new XMLWriter(new FileWriter("output.xml"),format);
writer.write(document);
writer.close();
字符串与XML的{?/strong>
1.字W串转化为XML
String text = "<members> <member>sitinspring</member> </members>";
Document document = DocumentHelper.parseText(text);
2.文档或节点的XML转化为字W串.
SAXReader reader = new SAXReader();
Document document = reader.read(new File("input.xml"));
Element root=document.getRootElement();
String docXmlText=document.asXML();
String rootXmlText=root.asXML();
Element memberElm=root.element("member");
String memberXmlText=memberElm.asXML();
使用XPath快速找到节?
d的XML文档CZ
<?xml version="1.0" encoding="UTF-8"?>
<projectDescription>
<name>MemberManagement</name>
<comment></comment>
<projects>
<project>PRJ1</project>
<project>PRJ2</project>
<project>PRJ3</project>
<project>PRJ4</project>
</projects>
<buildSpec>
<buildCommand>
<name>org.eclipse.jdt.core.javabuilder</name>
<arguments>
</arguments>
</buildCommand>
</buildSpec>
<natures>
<nature>org.eclipse.jdt.core.javanature</nature>
</natures>
</projectDescription>
使用XPath快速找到节点project.
public static void main(String[] args){
SAXReader reader = new SAXReader();
try{
Document doc = reader.read(new File("sample.xml"));
List projects=doc.selectNodes("/projectDescription/projects/project");
Iterator it=projects.iterator();
while(it.hasNext()){
Element elm=(Element)it.next();
System.out.println(elm.getText());
}
}
catch(Exception ex){
ex.printStackTrace();
}
}
解开后有两个?仅操作XML文档的话把dom4j-1.6.1.jar加入工程可以了,如果需要用XPath的话q需要加入包jaxen-1.1-beta-7.jar.
以下是相x?
一.Document对象相关
1.dXML文g,获得document对象.
SAXReader reader = new SAXReader();
Document document = reader.read(new File("input.xml"));
2.解析XML形式的文?得到document对象.
String text = "<members></members>";
Document document = DocumentHelper.parseText(text);
3.d创徏document对象.
Document document = DocumentHelper.createDocument();
Element root = document.addElement("members");// 创徏根节?br />
?节点相关
1.获取文档的根节点.
Element rootElm = document.getRootElement();
2.取得某节点的单个子节?
Element memberElm=root.element("member");// "member"是节点名
3.取得节点的文?br />
String text=memberElm.getText();
也可以用:
String text=root.elementText("name");q个是取得根节点下的name字节点的文字.
4.取得某节点下名ؓ"member"的所有字节点q进行遍?
List nodes = rootElm.elements("member");
for (Iterator it = nodes.iterator(); it.hasNext();) {
Element elm = (Element) it.next();
// do something
}
5.Ҏ节点下的所有子节点q行遍历.
for(Iterator it=root.elementIterator();it.hasNext();){
Element element = (Element) it.next();
// do something
}
6.在某节点下添加子节点.
Element ageElm = newMemberElm.addElement("age");
7.讄节点文字.
ageElm.setText("29");
8.删除某节?
parentElm.remove(childElm);// childElm是待删除的节?parentElm是其父节?br />
?属性相?
1.取得某节点下的某属?br />
Element root=document.getRootElement();
Attribute attribute=root.attribute("size");// 属性名name
2.取得属性的文字
String text=attribute.getText();
也可以用:
String text2=root.element("name").attributeValue("firstname");q个是取得根节点下name字节点的属性firstname的?
3.遍历某节点的所有属?br />
Element root=document.getRootElement();
for(Iterator it=root.attributeIterator();it.hasNext();){
Attribute attribute = (Attribute) it.next();
String text=attribute.getText();
System.out.println(text);
}
4.讄某节点的属性和文字.
newMemberElm.addAttribute("name", "sitinspring");
5.讄属性的文字
Attribute attribute=root.attribute("name");
attribute.setText("sitinspring");
6.删除某属?br />
Attribute attribute=root.attribute("size");// 属性名name
root.remove(attribute);
?文档写入XML文g.
1.文档中全?不设|编?直接写入的Ş?
XMLWriter writer = new XMLWriter(new FileWriter("output.xml"));
writer.write(document);
writer.close();
2.文档中含有中?讄~码格式写入的Ş?
OutputFormat format = OutputFormat.createPrettyPrint();
format.setEncoding("GBK"); // 指定XML~码
XMLWriter writer = new XMLWriter(new FileWriter("output.xml"),format);
writer.write(document);
writer.close();
?字符串与XML的{?br />
1.字W串转化为XML
String text = "<members> <member>sitinspring</member> </members>";
Document document = DocumentHelper.parseText(text);
2.文档或节点的XML转化为字W串.
SAXReader reader = new SAXReader();
Document document = reader.read(new File("input.xml"));
Element root=document.getRootElement();
String docXmlText=document.asXML();
String rootXmlText=root.asXML();
Element memberElm=root.element("member");
String memberXmlText=memberElm.asXML();
?使用XPath快速找到节?
d的XML文档CZ
<?xml version="1.0" encoding="UTF-8"?>
<projectDescription>
<name>MemberManagement</name>
<comment></comment>
<projects>
<project>PRJ1</project>
<project>PRJ2</project>
<project>PRJ3</project>
<project>PRJ4</project>
</projects>
<buildSpec>
<buildCommand>
<name>org.eclipse.jdt.core.javabuilder</name>
<arguments>
</arguments>
</buildCommand>
</buildSpec>
<natures>
<nature>org.eclipse.jdt.core.javanature</nature>
</natures>
</projectDescription>
使用XPath快速找到节点project.
public static void main(String[] args){
SAXReader reader = new SAXReader();
try{
Document doc = reader.read(new File("sample.xml"));
List projects=doc.selectNodes("/projectDescription/projects/project");
Iterator it=projects.iterator();
while(it.hasNext()){
Element elm=(Element)it.next();
System.out.println(elm.getText());
}
}
catch(Exception ex){
ex.printStackTrace();
}
}