日本高清久久一区二区三区,成人在线超碰,av一区在线

草儿 — Fri, 31 Aug 2007 01:04:00 GMT

最�q�本��Z��用google的网站访问分析工具对本博客在2007�q?�?9�?8�?0�?4��时的用戯��
问做了一下分析：

中国��问者分布如下：

草儿 2007-08-31 09:04 发表评论

JAVA�l��g�q��o器Filter

草儿 — Wed, 25 Jul 2007 05:56:00 GMT

同servlet非常�c�M��Q�Filter��是JAVA�l��g�Q�请求发送到servlet前，可以使用�q��o器Filter截获和处理请求，同时servlet�l�束以后�Q�响应发回以前同样可以��用过滤器Filter处理响应。WEB容器可以用web.xml部��v文�g声明何时调用�q��o器Filter�?/p>

�q��o器Filter主要功能是：1、完成安全检查；2、重新格式化��h��首部或体�Q?、徏立请求审计或记录日志---��h��q��o器Filter

1、压�~�响应流�Q?、追加或者修改响应流�Q?、创��Z��个定制响�?--响应�q��o器Filter

同servlet一��P��q��o器Filter也具有生命周期：init()->doFilter()->destroy().要实现模块化�Q�FilterChain功不可末�Q�它可以采用不同的方式组合过滤器�Q�协调完成一些事情，它由部��v文�g中的filter元素驱动�Q�和Filter都在javax.servlet包中。在servlet2.4中，�q��o器同样可以用于请求分�z�֙��Q�但��d��web.xml中声明，INCLUDE或FORWARD或REQUEST或ERROR该元素位于filter-mapping中�?/p>

1、实��C��個Filter�Q�代码如下：

public class MyFilter implements Filter {

public void init(FilterConfig arg0) throws ServletException {

}

public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException, ServletException{

HttpServletRequest httpRequest = (HttpServletRequest) request; HttpServletResponse httpResponse = (HttpServletResponse)response; CachedResponseWrapper wrapper = new CachedResponseWrapper(httpResponse); // 写入wrapper: chain.doFilter(request, wrapper); // 首先判断status, 只对200状态处理： if(wrapper.getStatus()==HttpServletResponse.SC_OK) { // 对响应进行处理，�q�里是进行GZip压羃: byte[] data = GZipUtil.gzip(wrapper.getResponseData()); httpResponse.setContentType(getContentType()); httpResponse.setContentLength(data.length); httpResponse.setHeader("Content-Encoding", "gzip");ServletOutputStream output = response.getOutputStream(); output.write(data); output.flush(); } }

public void destroy() {

}

2、实��C��个HttpServletResponseWrapper

public class CheckFrameHttpServletResponseWrapper extends HttpServletResponseWrapper {

public CheckFrameHttpServletResponseWrapper(HttpServletResponse response) {

super(response); }

public PrintWriter getWriter() throws IOException{ return new CheckFrameWriter(super.getWriter()); }

}

3、实��C��个Writer

public class CheckFrameWriter extends PrintWriter { String checkString = "\n";

public CheckFrameWriter(Writer out) { super(out); }

public void write(int c) { super.write((char) c); }

public void write(char buf[], int off, int len) { StringBuffer sb = new StringBuffer(len); for (int i = 0; i < len; i++) { sb.append(buf[off + i]); } String s = sb.toString(); int bodyIndex = s.indexOf(""); if (bodyIndex > -1) { String part1 = s.substring(0, bodyIndex); String part2 = s.substring(bodyIndex ); s = part1 + checkString + part2; } for (int i = 0; i < s.length(); i++) { write(s.charAt(i)); } }

public void write(String s, int off, int len) { for (int i = 0; i < len; i++) { write(s.charAt(off + i)); } } }

在Writer中，你便可以随心所�Ʋ的修改Response的內容了�?/p>

4、在Web.xml中加入相应的配置元素�Q�对JSP�q�行拦截�?/p>

草儿 2007-07-25 13:56 发表评论

一个Servlet生命周期�Q�Tomcat处理��h��中）

草儿 — Sat, 07 Jul 2007 08:04:00 GMT

从Tomcat处理用户��h��Q�我们可以清晰的看到容器Servlet的生命周期管理过�E�：
1、客户发��求�?gt;Web 服务器�{发到Web容器Tomcat�Q?br>2、Tomcat�ȝ��E�对转发来用��L��h��做出响应创徏两个对象�Q�HttpServletRequest和HttpServletResponse�Q?br>3、从��h��中的URL中找到正��Servlet�Q�Tomcat为其创徏或者分配一个线�E�，同时�?创徏的两个对象传递给该线�E�；
4、Tomcat调用Servlet的servic()�Ҏ��Q�根据请求参数的不同调用doGet()或者doPost()�Ҏ��Q?br>5、假设是HTTP GET��h��Q�doGet()�Ҏ��生成静态页面，�q�组合到响应对象里；
6、Servlet�U�程�l�束�Q�Tomcat��响应对象�{换�ؓHTTP响应发回�l�客��P��同时删除��h��和响应对象�?br>从该�q�程中，我们可以理解Servlet的生命周期：Servlet�c�d��载（对应3步）�Q�Servlet实例化（对应3步）�Q�调用init�Ҏ��Q�对�?步）�Q�调用service()�Ҏ��Q�对�?�?步）�Q�；调用destroy()�Ҏ��Q�对�?步）�?img src ="http://www.aygfsteel.com/mlh123caoer/aggbug/128789.html" width = "1" height = "1" />

草儿 2007-07-07 16:04 发表评论

草儿 — Mon, 25 Jun 2007 10:33:00 GMT

JDOM是一�U��?XML 的独�?Java 工具包，用于快速开�?XML 应用�E�序。它�?/font>设计�?/font>�?Java 语言的语法乃臌��义�?

JDOM是两位著名的 Java 开发�h员兼作者，Brett Mclaughlin �?Jason Hunter 的创作成果， 2000 �q�初�?/font>�c?/u>��g�� Apache 协议的许可下�Q�JDOM 作�ؓ一个开放源代码��目正式开始研发，JDOM 作�ؓ一个开放源代码��目正式开始了。它已成长�ؓ包含来自�q�泛�?Java 开发�h员的投稿、集中反馈及错误修复的系�l�，�q�致力于建立一个完整的��Z�� Java �q�_��的解��x��案，通过 Java 代码来访问、操作�ƈ输出 XML 数据�?

虽然许多Java 开发�h员每天都在��?XML�Q�Sun 却在��?XML 整合�q?Java �q�_��斚w��落后了。因为在 XML 成�ؓ从商家对商家集成�?Web 站点内容��水化等斚w��的关键技术之前，Java 2 �q�_��已�l�非常流行了。Sun 已经使用 JSR �q�程使之成�ؓ现存 XML API 的��E��，�q�一点已被广泛接受。目前最显著的是加入�?JAXP �Q�用�?XML 语法分析�?Java API�Q�，其中包含了三�?a target=_new>软�g�?/font>�Q?

      ·org.w3c.dom �Q�W3C 推荐的用�?XML 标准规划文档对象模型�?Java 工具
      ·org.xml.sax �Q�用于对 XML �q�行语法分析的事仉��动的��?API
      ·javax.xml.parsers �Q�工厂化工具�Q�允许应用程序开发�h员获得�ƈ配置�Ҏ��的语法分析器工具 JDOM 能够替换 org.w3c.dom 软�g包来有计划地操作 XML 文档

JDOM是一�?a target=_new>开�?/font>��目�Q�它��Z��树型�l�构�Q�利用纯JAVA的技术对XML文档实现解析、生成、序列化以及多种操作�?/p>

JDOM 直接为JAVA�~�程服务。它利用更�ؓ强有力的JAVA语言的诸多特性（�Ҏ��重蝲、集合概念以及映��）�Q�把SAX和DOM的功能有效地�l�合��h��?/p>

Jdom是用Java语言诅R��写、操作XML的新API函数。Jason Hunter �?Brett McLaughlin公开发布了它�?.0版本。在直觉、简单和高效的前提下�Q�这些API函数被最大限度的优化。在接下来的��幅里将介绍怎么用Jdom去读写一个已�l�存在的XML文档�?/p>

在��用设计上��可能地隐藏原来使用XML�q�程中的复杂性。利用JDOM处理XML文档��是一件轻松、简单的事�?/p>

JDOM �?000�q�的春天被Brett McLaughlin和Jason Hunter开发出来，以��I补DOM及SAX在实际应用当中的不��之处�?/p>

�q�些不��之处主要在于SAX没有文档修改、随��问以及输出的功能�Q�而对于DOM来说�Q�JAVA�E�序员在使用时来用�v来总觉得不太方�ѝ�?/p>

DOM的缺点主要是来自于由于Dom是一个接口定义语�a��Q�IDL�Q?它的��d��是在不同语言实现中的一个最低的通用标准�Q��ƈ不是为JAVA特别设计的。JDOM的最新版本�ؓJDOM Beta 9。最�q�JDOM被收录到JSR-102内，�q�标志着JDOM成�ؓ了JAVA�q�_��l�成的一部分�?/p>

�?JDOM 中，XML 元素��是 Element 的实例，XML 属性就�?Attribute 的实例，XML 文档本��n��是 Document 的实例�?/p>

因�ؓ JDOM 对象��是�?Document、Element �?Attribute �q�些�cȝ��直接实例�Q�因此创��Z��个新 JDOM 对象��如�?Java 语言中��?new 操作�W�一样容易。JDOM 的��用是直截了当的�?/p>

JDOM 使用标准�?Java �~�码模式。只要有可能�Q�它使用 Java new 操作�W�而不故弄玄虚使用复杂的工厂化模式�Q��对象操作即便对于初学用户也很方便�?/p>

一、JDOM包概�?/strong>

JDOM是由以下几个包组成的

org.jdom包含了所有的xml文档要素的java�c?br>org.jdom.adapters包含了与dom适配的java�c?br>org.jdom.filter包含了xml文档的过滤器�c?br>org.jdom.input包含了读取xml文档的类
org.jdom.output包含了写入xml文档的类
org.jdom.transform包含了将jdomxml文档接口转换为其他xml文档接口
org.jdom.xpath包含了对xml文档xpath操作的类

二、JDOM�c�说�?/strong>

      1、org.JDOM�q�个包里的类是你J解析xml文�g后所要用到的所有数�?a target=_new>�c�d��?/p>
Attribute
CDATA
Coment
DocType
Document
Element
EntityRef
Namespace
ProscessingInstruction
Text

      2、org.JDOM.transform在涉及xslt格式转换时应使用下面�?个类

JDOMSource
JDOMResult
org.JDOM.input

      3、输入类�Q�一般用于文档的创徏工作

SAXBuilder
DOMBuilder
ResultSetBuilder

      4、org.JDOM.output输出�c�，用于文档转换输出

XMLOutputter
SAXOutputter
DomOutputter
JTreeOutputter

      使用前注意事��：

      1.JDOM对于JAXP以及TRax的支�?/p>
      JDOM支持JAXP1.1�Q�你可以在程序中使用��M��的parser工具�c?默认情况下是JAXP的parser�?br>制定特别的parser可用如下形式
SAXBuilderparser
=newSAXBuilder("org.apache.crimson.parser.XMLReaderImpl");
Documentdoc=parser.build("http://www.cafeconleche.org/");
//workwiththedocument...
JDOM也支持TRaX�Q�XSLT可通过JDOMSource以及JDOMResult�c�L��转换�Q�参见以后章节）

      2.注意在JDOM里文档（Document�Q�类由org.JDOM.Document来表�C�。这要与org.w3c.dom中的Document区别开�Q�这2�U�格式如何�{换在后面会说明�?br>      以下如无�Ҏ��均指JDOM里的Document�?/p>
三、JDOM主要使用�Ҏ��

1.Ducument�c?/p>
(1)Document的操作方法：

Elementroot=newElement("GREETING");
Documentdoc=newDocument(root);
root.setText("HelloJDOM!");
或者简单的使用Documentdoc=newDocument(newElement("GREETING").setText("HelloJDOM!t"));
�q�点和DOM不同。Dom则需要更为复杂的代码�Q�如下：
DocumentBuilderFactoryfactory=DocumentBuilderFactory.newInstance();
DocumentBuilderbuilder=factory.newDocumentBuilder();
Documentdoc=builder.newDocument();
Elementroot=doc.createElement("root");
Texttext=doc.createText("Thisistheroot");
root.appendChild(text);
doc.appendChild(root);
注意事项�Q�JDOM不允许同一个节点同时被2个或多个文档相关联，要在�W?个文档中使用原来老文档中的节点的话。首先需要��用detach()把这个节点分开来�?/p>
(2)从文件、流、系�l�ID、URL得到Document对象�Q?/p>
DOMBuilderbuilder=newDOMBuilder();
Documentdoc=builder.build(newFile("jdom_test.xml"));
SAXBuilderbuilder=newSAXBuilder();
Documentdoc=builder.build(url);
在新版本中DOMBuilder已经Deprecated掉DOMBuilder.builder(url)�Q�用SAX效率会比较快�?br>�q�里举一个小例子�Q��ؓ了简单�v见，使用String对象直接作�ؓxml数据源：
PublicjdomTest(){
StringtextXml=null;
textXml="";
textXml=textXml+
"aaabbbcccddd";
textXml=textXml+"";
SAXBuilderbuilder=newSAXBuilder();
Documentdoc=null;
Readerin=newStringReader(textXml);
try{
doc=builder.build(in);
Elementroot=doc.getRootElement();
Listls=root.getChildren();//注意此处取出的是root节点下面的一层的Element集合
for(Iteratoriter=ls.iterator();iter.hasNext();){
Elementel=(Element)iter.next();
if(el.getName().equals("to")){
System.out.println(el.getText());
}
}
}
catch(IOExceptionex){
ex.printStackTrace();
}
catch(JDOMExceptionex){
ex.printStackTrace();
}
}
(3)DOM的document和JDOM的Document之间的相互�{换��用方法，��单！
DOMBuilderbuilder=newDOMBuilder();
org.jdom.DocumentjdomDocument=builder.build(domDocument);
DOMOutputterconverter=newDOMOutputter();//workwiththeJDOMdocument…
org.w3c.dom.DocumentdomDocument=converter.output(jdomDocument);
//workwiththeDOMdocument…

2.XML文档输出

XMLOutPutter�c�：
JDOM的输出非常灵�z?支持很多�U�io格式以及风格的输�?br>Documentdoc=newDocument(...);
XMLOutputteroutp=newXMLOutputter();
outp.output(doc,fileOutputStream);//Rawoutput
outp.setTextTrim(true);//Compressedoutput
outp.output(doc,socket.getOutputStream());
outp.setIndent("");//Prettyoutput
outp.setNewlines(true);
outp.output(doc,System.out);
详细请参阅最新的JDOMAPI手册

3.Element�c�：

(1)��览Element�?br>Elementroot=doc.getRootElement();//获得根元素element
ListallChildren=root.getChildren();//获得所有子元素的一个list
ListnamedChildren=root.getChildren("name");//获得指定名称子元素的list
Elementchild=root.getChild("name");//获得指定名称的第一个子元素
JDOM�l�了我们很多很灵�zȝ��使用�Ҏ��来管理子元素�Q�这里的List是java.util.List�Q?br>ListallChildren=root.getChildren();
allChildren.remove(3);//删除�W�四个子元素
allChildren.removeAll(root.getChildren("jack"));//删除�?#8220;jack”的子元素
root.removeChildren("jack");//便捷写法
allChildren.add(newElement("jane"));//加入
root.addContent(newElement("jane"));//便捷写法
allChildren.add(0,newElement("first"));

(2)�U�d��Elements:
在JDOM里很��?br>Elementmovable=newElement("movable");
parent1.addContent(movable);//place
parent1.removeContent(movable);//remove
parent2.addContent(movable);//add
在Dom�?br>Elementmovable=doc1.createElement("movable");
parent1.appendChild(movable);//place
parent1.removeChild(movable);//remove
parent2.appendChild(movable);//出错!
补充�Q�纠错�?br>JDOM的Element构造函敎ͼ�以及它的其他函数�Q�会��查element是否合法�?br>而它的add/remove�Ҏ��会检查树�l�构�Q�检查内容如下：
1.在�Q何树中是否有回环节点
2.是否只有一个根节点
3.是否有一致的命名�I�间�Q�Namespaces�Q?/p>
(3)Element的text内容��d��

Acooldemo

//Thetextisdirectlyavailable
//Returns"\nAcooldemo\n"
Stringdesc=element.getText();
//There'saconvenientshortcut
//Returns"Acooldemo"
Stringdesc=element.getTextTrim();
(4)Elment内容修改
element.setText("Anewdescription");
3.可正��解释特�D�字�W?br>element.setText("

四、JDOM的应�?/strong>

�Q�一�Q�、XML文档创徏

      我们由零开始利用JDOM生成一个XML文档。最后的�l�果(��h��文档)看�v来象�q�样�Q?/p>

kingwong

87654321

1.�?MyInfo 为根元素创徏文档

Element rootElement = new Element("MyInfo");//所有的XML元素都是 Element 的实例。根元素也不例外�Q�）
Document myDocument = new Document(rootElement);//以根元素作�ؓ参数创徏Document对象。一个Document只有一个根�Q�即root元素�?/p>
2.�l�根元素��d��属�?/p>
Attribute rootAttri = new Attribute("comment","introduce myself");//创徏名�ؓ commnet,��gؓ introduce myself 的属性�?br>rootElement.setAttribute(rootAttri);//��刚创徏的属性添加到根元素�?br>�q�两行代码你也可以合成一行来写，象这��P��
rootElement.setAttribute(new Attribute("comment","introduce myself"));
或�?br>rootElement.setAttribute("comment","introduce myself");

3.��d��元素和子元素

JDOM里子元素是作�?content�Q�内容）��d��到父元素里面�ȝ��,所谓content��是�c�M��上面��h��文档中之间的东东�Q�即kingwong。罗嗦了�Ҏ��吧：�Q?br>Element nameElement = new Element("name");//创徏 name 元素
nameElement.addContent("kingwong");//��kingwong作�ؓcontent��d��到name元素
rootElement.addContent(nameElement);//��name元素作�ؓcontent��d��到根元素

�q�三行你也可以合��Z��句，象这��P��
rootElement.addContent((Content)(new Element("name").addContent("kingwong")));//因�ؓaddContent(Content child)�Ҏ��q�回的是一个Parent接口�Q�而Element�c�d��时��承了Content�c�d��实现了Parent接口�Q�所以我们把它造型成Content�?/p>
我们用同��L��Ҏ��d��带属性的子元�?br>rootElement.addContent(new Element("sex").setAttribute("value","male"));//注意�q�里不需要�{型，因�ؓaddAttribute(String name,String value)�q�回值就是一�?Element�?/p>
同样的，我们��d��元素到根元素下，用法上一��P��只是�E�微复杂了一些：
rootElement.addContent((Content)(new Element("contact").addContent((Content)(new Element("telephone").addContent("87654321")))));
如果你对�q�种��写�Ş式还不太习惯�Q�你完全可以分步来做�Q�就象本节刚开始的时候一栗��事实上如果层次比较多，写成分步的�Ş式更清晰些，也不�Ҏ��出错�?/p>
4.删除子元�?/p>
�q�个操作比较��单：
rootElement.removeChild("sex");//该方法返回一个布��?/p>
到目前�ؓ止，我们学习了一下JDOM文档生成操作。上面徏立了一个样本文档，可是我们怎么知道对不对呢�Q�因此需要输出来看一下。我们将JDOM生成的文档输出到控制収ͼ�使用 JDOM �?XMLOutputter �c�R�?/p>
5. ��?JDOM 转化�?XML 文本

XMLOutputter xmlOut = new XMLOutputter(" ",true);
try {
xmlOut.output(myDocument,System.out);
} catch (IOException e) {
e.printStackTrace();
}
XMLOutputter 有几个格式选项。这里我们已指定希望子元素从父元素羃�q�两个空��|��q�且希望元素间有�I��?br>new XMLOutputter(java.lang.String indent, boolean newlines)�q�个�Ҏ��在最新版本中已经不徏议��用。JDOM有一个专门的用来定义格式化输出的�c�：org.jdom.output.Format�Q�如果你没有�Ҏ��的要求，有时候��用里面的几个静态方法（应该可以说是预定义格式）�?getPrettyFormat()��可以了。我们把上面的输出格式稍微改一下，��p��q�样�Q?br>XMLOutputter xmlOut = new XMLOutputter(Format.getPrettyFormat());

6.��JDOM文档转化为其他�Ş�?/p>
XMLOutputter �q�可输出�?Writer �?OutputStream。�ؓ了输出JDOM文档��C��个文本文�Ӟ��我们可以�q�样做：
FileWriter writer = new FileWriter("/some/directory/myFile.xml");
outputter.output(myDocument, writer);
writer.close();

XMLOutputter �q�可输出到字�W�串,以便�E�序后面�q�行再处�?
Strng outString = xmlOut.outputString(myDocument);

当然�Q�在输出的时候你不一定要输出所有的整个文档�Q�你可以选择元素�q�行输出�Q?br>xmlOut.output(rootElement.getChild("name"),System.out);
一句话�Q�JDOM非常灉|��方便�Q�如果你惌��一步研�I�JDOM�Q�请到官方网站去看一看：http://www.jdom.org

本节�C�Z��源码�Q?br>package com.cyberobject.study;

import java.io.IOException;

import org.jdom.Attribute;
import org.jdom.Content;
import org.jdom.Document;
import org.jdom.Element;
import org.jdom.output.Format;
import org.jdom.output.XMLOutputter;

/**
* @author kingwong
*
* TODO To change the template for this generated type comment go to
* Window - Preferences - Java - Code Style - Code Templates
*/
public class TestJDOM {

public static void main(String[] args)
{
Element rootElement = new Element("MyInfo");
Document myDocument = new Document(rootElement);

// Attribute rootAttri = new Attribute("comment","introduce myself");
// rootElement.setAttribute(rootAttri);

rootElement.setAttribute("comment","introduce myself");
//rootElement.setAttribute(new Attribute("comment","introduce myself"));
// Element sexElement = new Element("sex");
// rootElement.addContent(sexElement);

// Element nameElement = new Element("name");
// nameElement.addContent("kingwong");
// rootElement.addContent(nameElement);

rootElement.addContent((Content)(new Element("name").addContent("kingwong")));
rootElement.addContent(new Element("sex").setAttribute("value","male"));
rootElement.addContent((Content)(new Element("contract").addContent((Content)(new Element("telephone").addContent("87654321")))));

rootElement.removeChild("sex");

XMLOutputter xmlOut = new XMLOutputter(Format.getPrettyFormat());
try {
xmlOut.output(myDocument,System.out);
//xmlOut.output(rootElement.getChild("name"),System.out);
//String outString = xmlOut.outputString(myDocument);
} catch (IOException e) {
e.printStackTrace();
}
}
}

�Q�二�Q�、XML文档解析

JDOM 不光可以很方便的建立XML文档�Q�它的另一个用处是它能够读取�ƈ操作现有�?XML 数据�?br>JDOM的解析器在org.jdom.input.*�q�个包里�Q�其中的DOMBuilder的功能是��DOM模型的Document解析成JDOM模型的Document�Q�SAXBuilder的功能是从文件或��中解析出符合JDOM模型的XML树。由于我们经常要从一个文仉��d��数据�Q�因此我们应该采用后者作��析工兗��?br>解析一个xml文档�Q�基本可以看成以下几个步骤：

1.实例化一个合适的解析器对�?/p>
本例中我们��用SAXBuilder:
SAXBuilder sb = new SAXBuilder();

2.以包含XML数据的文件�ؓ参数�Q�构��Z��个文档对象myDocument

Document myDocument = sb.build(/some/directory/myFile.xml);

3.获到根元�?/p>
Element rootElement = myDocument.getRootElement();

一旦你获取了根元素�Q�你��可以很方便地对它下面的子元素进行操作了�Q�下面对Element对象的一些常用方法作一下简单说明：
getChild("childname") �q�回指定名字的子节点,如果同一�U�有多个同名子节点，则只�q�回�W�一个；如果没有�q�回null倹{�?br>getChildren("childname") �q�回指定名字的子节点List集合。这样你��可以遍历所有的同一�U�同名子节点�?
getAttributeValue("name") �q�回指定属性名字的倹{��如果没有该属性则�q�回null,有该属性但是��gؓ�I�，则返回空字符丌Ӏ?br>getChildText("childname") �q�回指定子节点的内容文本倹{�?br>getText() �q�回该元素的内容文本倹{�?/p>
�q�有其他没有�|�列出来的方法，如果需要的话，可以随时查阅JDOM的在�U�文档：http://www.jdom.org/docs/apidocs/index.html。当然你可以在你需要的地方��d��、删除元素操作，�q�记得上面的创徏XML的方法吗�Q�呵呵~~~

学习��C��东还是从实例学�v最为快��P��下面��单�D个例子，��׃��上面的XML��h��代码来学习JDOM的XML解析。本例中��d��了样本XML文�g里一些属性和content�Q�最后我们还在contact元素里插入了一个新元素wanghua@cyberobject.com" />。尽��我们实��C��对于XML的基本操作，�l�心的朋友可能会
有疑问：如果XML文档的层�ơ稍微复杂一些，如果嵌套多达几十上百层的话（开个玩�W�）�Q�如果靠�q�样从根元素一�U�一�U�地通过getChild("childname")来访问子元素的话�Q�将会非常痛苦！是的�Q�的��是�q�样�Q�但是我们有另一个有力的工具XPath�Q��ؓ什么不用呢�Q�这是后话！先卖个关子（手敲累啦�Q�下回吧�Q�呵呵）�?/p>
/*
* Created on 2004-8-21
*
* TODO To change the template for this generated file go to
* Window - Preferences - Java - Code Style - Code Templates
*/
package com.cyberobject.study;

import org.jdom.Document;
import org.jdom.Element;
import org.jdom.input.SAXBuilder;
import org.jdom.output.Format;
import org.jdom.output.XMLOutputter;

/**
* @author kingwong
*
* TODO To change the template for this generated type comment go to
* Window - Preferences - Java - Code Style - Code Templates
*/
public class TestJDOM2 {
public static void main(String[] args){
SAXBuilder sb = new SAXBuilder();
try
{
Document doc = sb.build("myFile.xml");
Element root = doc.getRootElement();

String str1 = root.getAttributeValue("comment");
System.out.println("Root Element's comment attribute is : " + str1);
String str2 = root.getChild("sex").getAttributeValue("value");
System.out.println("sex Element's value attribute is : " + str2);
String str3 = root.getChildText("name");
System.out.println("name Element's content is :" + str3);
String str4 = root.getChild("contact").getChildText("telephone");
System.out.println("contact Element's telephone subelement content is : " + str4 + "\n");
Element inputElement = root.getChild("contact");
inputElement.addContent(new Element("email").setAttribute("value","wanghua@cyberobject.com"));

XMLOutputter xmlOut = new XMLOutputter(Format.getPrettyFormat());
String outStr = xmlOut.outputString(root);
System.out.println(outStr);
}
catch(Exception e)
{
e.printStackTrace();
}
}
}

草儿 2007-06-25 18:33 发表评论

MySQL DB学习�W�记A

草儿 — Sat, 07 Apr 2007 07:28:00 GMT
MySQL DB是当今开源世界上最��行的free数据库，它的蓬勃发展和广泛的应用�Q�奠定了当今��L��数据库市场的一席�?br>
一、数据库��?br>MySQL 是一个快速、多�U�程、多用户和强壮的SQL数据库服务器�?/p>
对Unix�?nbsp;OS/2 �q�_��Q�MySQL基本上是免费的；但对微��Y�q�_��Q�你�?0 天的试用期后必须获得一个MySQL 许可证。详�?a >�W�三�?MySQL许可证和技术支�?/a>�?

MySQL是一个真正的多用戗��多�U�程SQL数据库服务器。SQL�Q�结构化查询语言�Q�是世界上最��行的和标准化的数据库语�a�。MySQL是以一个客��h��/服务器结构的实现�Q�它�׃��个服务器守护�E�序mysqld和很多不同的客户�E�序和库�l�成�?/p>
SQL是一�U�标准化的语�a��Q�它使得存储、更新和存取信息更容易。例如，你能用SQL语言��Z��个网站检索��品信息及存储��֮�信息�Q�同时MySQL也��够快和灵�z�M��允许你存储记录文件和囑փ��?/p>
MySQL 主要目标是快速、健壮和易用。最初是因�ؓ我们需要这样一个SQL服务器，它能处理与�Q何可不昂�늡�件��^��C��提供数据库的厂家在一个数量��上的大型数据库，但速度更快�Q�MySQL��开发出来。自1996�q�以来，我们一直都在��用MySQL�Q�其环境有超�q?nbsp;40 个数据库�Q�包�?nbsp;10,000个表�Q�其�?00多个表超�q?百万行，�q�大�U�有100 个吉字节(GB)的关键应用数据�?/p>
MySQL建立的基��是业已用在高要求的生产环境多�q�的一套实用例�E�。尽��MySQL仍在开发中�Q�但它已�l�提供一个丰富和极其有用的功能集�?/p>
二、MySQL 的主要特�?br>

下表描述MySQL一些重要的特征�Q?

使用核心�U�程的完全多�U�程。这意味着它能很容易地利用多CPU�Q�如果有�Q��?
C 、C++�?nbsp;Eiffel �?nbsp;Java�?nbsp;Perl�?nbsp;PHP、Python、和 TCL  API。见20 MySQL 客户工具�?nbsp;API�?
可运行在不同的��^��C��Q�见4.2 MySQL支持的操作系�l?/a>�?
多种列类型：1�?nbsp;2�?nbsp;3�?、和 8 字节长度的有�W�号/无符��h��数�?code>FLOAT�?code>DOUBLE�?code>CHAR�?code>VARCHAR�?code>TEXT�?code>BLOB�?code>DATE�?code>TIME�?code>DATETIME�?/code> TIMESTAMP�?code>YEAR�?code>SET�?code>ENUM�c�d��?�?a >7.3 列类�?/a>�?
利用一个优化的一遍扫描多重联�l�（one-sweep multi-join�Q�非常快速地�q�行联结(join)�?
在查询的SELECT�?code>WHERE部分支持全部�q�算�W�和函数�Q�例如：
mysql> SELECT CONCAT(first_name, " ", last_name) FROM tbl_name WHERE income/dependents > 10000 AND age > 30;

通过一个高度优化的�c�d��实现SQL函数库�ƈ且像他们能达到的一样快速，通常在查询初始化后不应该有�Q何内存分配�?
全面支持SQL�?code>GROUP BY�?code>ORDER BY子句�Q�支持聚合函�? COUNT()�?code>COUNT(DISTINCT)�?code>AVG()�?code>STD()�?code>SUM()�?MAX()�?code>MIN() )�?
支持ANSI SQL�?code>LEFT OUTER JOIN和ODBC语法�?/code>
你可以在同一查询中�؜用来自不同数据库的表�?与版�?nbsp;3.22一�?nbsp;)�?
一个非常灵�z�M��安全的权限和口��o�pȝ��Q��ƈ且它允许��Z��L��的认证。口令是安全的，因�ؓ当与一个服务器�q�接�Ӟ��所有的口��o传送被加密�?
ODBC for Windiws 95。所有的 ODBC 2 . 5 函数和其他许多函数。例如，你可以用Access�q�接你的 MySQL服务器。见16 MySQL  ODBC 支持�?
具备索引压羃的快速B树磁盘表�?
每个表允许有16个烦引。每个烦引可以由1�?6个列或列的一部分�l�成。最大烦引长度是 256 个字�?在编译MySQL�Ӟ��它可以改�?。一个烦引可以��用一�?code>CHAR�?code>VARCHAR字段的前�~��?
定长和变长记录�?
用作临时表的内存散列表�?
大数据库处理。我们正在对某些包含 50,000,000 个记录的数据库��用MySQL�?
所有列都有�~�省��|��你可以用INSERT插入一个表列的子集�Q�那些没用明��给定值的列设�|��ؓ他们的缺省倹{�?
��Z��可移植性��?nbsp;GNU  Automake , Autoconf �?code>libtool�?/code>
用C和C++�~�写�Q��ƈ用大量不同的�~�译器测试�?
一个非常快速的��Z��U�程的内存分配系�l��?
没有内存漏洞。用一个商用内存漏�z�监��程序测试过(purify)�?
包括myisamchk�Q�一个检查、优化和修复数据库表的快速实用程序，详见13 �l�护 MySQL安装�?
全面支持ISO-8859-1  Latin1 字符集。例如，斯堪的纳�l�亚的字�W?@ringaccent{a}, @"a and @"o 在表和列名字被允许�?
所有数据以 ISO-8859-1  Latin1 格式保存。所有正常的字符串比较是忽略大小写的�?
�Ҏ�� ISO-8859-1  Latin1 字符集进行排�?目前瑞典语的方式)。通过在源代码中增加排序顺序数�l�可以改变它。�ؓ了理解一个更高��的排序例子，看一看捷克语的排序代码。MySQL支持可在�~�译时指定的很多不同的字�W�集�?
表和列的别名�W�合 SQL92 标准�?
DELETE�?code>INSERT�?code>REPLACE�?code>UPDATE �q�回有多��行被改�?受媄�?�?
函数名不会与表或列名冲突。例�?code>ABS是一个有效的列名字。对函数调用的唯一限制是函数名与随后的“(”不能有空根{��详�?a >7.31 MySQL对保留字很挑剔吗�Q?/a>�?
所有MySQL�E�序可以用选项--help�?code>-?获得联机帮助�?
服务器能为客��h��供多�U�语�a�的出错消息，详见9.1 MySQL支持哪些语言�Q?/a>�?
客户端��用TCP/IP �q�接或Unix套接字（socket�Q�或NT下的命名��道�q�接MySQL�?
MySQL�Ҏ��的SHOW命��o可用来检索数据库、表和烦引的信息�Q�EXPLAIN命��o可用来确定优化器如何解决一个查询�?

三、SQL语法

      ��d��MySQL服务器语法：mysql -h host_name -u user_name -p [password];
    1、创建、删除数据库
             CREATE DATABASE [IF NOT EXISTS] db_name
             例如�Q�create DATABASE Samp_db;
             DROP DATABASE [IF EXISTS] db_name
            例如�Q�drop DATABASE Samp_db;

    2、创��?br>              CREATE [TEMPORARY] TABLE [IF NOT EXISTS] tbl_name [(create_definition,...)][table_options]               [select_statement]�Q?br>           例如�Q�mysql> CREATE TABLE test (a INT NOT NULL AUTO_INCREMENT,
                               ->        PRIMARY KEY (a), KEY(b))
                               ->        TYPE=MyISAM SELECT b,c FROM test2;

    3、插入数�?br>           INSERT [LOW_PRIORITY | DELAYED] [IGNORE]
                   [INTO] tbl_name [(col_name,...)]
                  VALUES ((expression | DEFAULT),...),(...),...
                   [ ON DUPLICATE KEY UPDATE col_name=expression, ... ]
         or INSERT [LOW_PRIORITY | DELAYED] [IGNORE]
                  [INTO] tbl_name [(col_name,...)]
                  SELECT ...
        or INSERT [LOW_PRIORITY | DELAYED] [IGNORE]
                   [INTO] tbl_name
        SET col_name=(expression | DEFAULT), ...
                    [ ON DUPLICATE KEY UPDATE col_name=expression, ... ]
        例如�Q�mysql> INSERT INTO tbl_name (col1,col2) VALUES(15,col1*2);

草儿 2007-04-07 15:28 发表评论

数据挖掘与统计学

草儿 — Fri, 12 Jan 2007 13:57:00 GMT
     摘要: Data Mining from a Statistical Perspective John Maindonald Statistical Consulting Unit of the Graduate School�Q?Australian National University ...  阅读全文

草儿 2007-01-12 21:57 发表评论

SDO2.0�Q�创建和��d�� XML 文档

草儿 — Fri, 12 Jan 2007 01:42:00 GMT

引言�Q�什么是 SDO�Q?/font>

Service Data Object (SDO) 2.0 是一个开放标准数据模型编�E?API�Q�允许开发�h员在较高的��别方便地操作数据。尽��?SDO 1.0 以相同的数据抽象为目标，但有几个大的�~�点�Q�其中主要的一�Ҏ��~�少 Helper �c�，�?XSDHelper, XMLHelper �{�。而最�l�结果是�Q�开发�h员被�q��?SDO 1.0 实现 API�Q�来�?Eclipse Modeling Framework (EMF) SDK�Q��?

当前的实�?(SDO 2.0) 使用 EMF 2.2 SDK�Q�但�q�个 SDO 2.0 实现�l�节�q�不会媄响开发�h员根据新 API �~�写�E�序。将来，开放源代码�C�֌��Q�通过 Apache Software Foundation�Q�可能会军_��提供不同�?SDO 2.0 实现�Q�但�q�不应媄响基�?SDO 2.0 API 构徏的应用程序�?/p>
了解�q�个�?API 的优势的最基本�Ҏ��是��?SDO 2.0 来创建符�?XML 模式 (XSD) �?XML 文档�q�对其进行读取操作。要在不使用 SDO 2.0 的情况下完成相同的工作，开发�h员需要理�?XML 解析器如何工作，�q�将数据解析逻辑与应用程序紧密集成。如果以�?XSD 需要更改，��需要对应用�E�序的各处进行调��_��从而可能对代码的质量带来灾难性的影响�?

SDO 2.0 API 的新用户很难直接通过学习规范来理解相��x��c��ؓ了提供一定的帮助�Q�我们从 XML Schema Primer�Q�请参阅参考资�?/font>�Q�创��Z��一个示例，以说明如何��?SDO 2.0 API �q�行以下��d��Q?/p>

��?XML 文档写入到磁�?

从磁盘读取该文档�?

场景�Q�购买订单信息收集和配�?/font>

以下是我们将��试通过我们的示例实现的使用场景。首先，公司��定购买订单�Q�purchase order�Q�PO�Q�信息的要求。完成此��d��后，我们��开始创建静态表单，以设计信息的�l�构。在数据库中�Q�此静态表单即表模式。在 XML�Q�此静态表单即 XML 模式 (XSD)。如果以后需要收集更多的客户信息�Q�我们将需要重新设计表�?表模�?XSD�?/p>
下订单时�Q�客户需要填�?PO 表单�Q�或向操作员提供相同的信息，以便填写此表单。表单中的信息将随后由公司用于对订单�q�行配送�?

公司接收�?PO 信息后，很有可能会将其进行保存，�q�在以后对其�q�行��d��以用于各�U�目的（如提供客��h��持）。在此示例中�Q�我们可以将信息�?XML 格式保存�Q�然后��?SDO API �q�行��d��?/p>
�?1 昄��了从客户 Robert Smith 攉��?PO 信息�C�Z��。将创徏 XSD 文�g�Q�以采用�l�构化的方式存储此示例购买订单。将用一个名�?CreatePurchaseOrder.java 的示例程序来采用 XML 格式创徏�C�Z�� PO�Q�名�?po.xml�Q�。最后，��?ReadPurchaseOrder.java 来演�C�如何从 po.xml ��d��订单信息�?/p>
�?1. 来自 Rober Smith 的示例购买订单信�?/b>

Order date: 1999-10-20
Shipping information:
Name:Alice Smith
Street:123 Maple Street
City:Mill Valley
State:CA
Zip code: 90952
Country:US
Billing information:
Name:Robert Smith
Street:8 Oak Avenue
City:Mill Valley
State:PA
Zip code: 95819
Country:US
Order Items:
1. Part number:872-AA
Product name:Lawnmower
Quantity: 1
Price: 148.95
Comment:Confirm this is electric
2. Part number:926-AA
Product name:Baby Monitor
Quantity: 1
Price: 39.98
Ship date: 1999-05-21
Comment: Hurry, my lawn is going wild!

回页�?/font>

购买订单�?XML 模式

��Z��?1 所�C�的�C�Z��购买订单�Q�可以��用一�?PO �c�d��来表�C��单。我们将其命名�ؓ PurchaseOrderType�?code>PurchaseOrderType 的实例可以包含四个主要数据，如下所�C�：

shipping information

billing information

order items information

comment

shipping information �?billing information 可包含更多的数据�Q�如 name�?code>street�?code>city�?code>state�?code>zip �?country。Order items information 可以包含客户所购买的物品的很多信息。每个物品可能包�?part number�?code>product name�?code>quantity, price�?code>ship date �?comment。PO �?comment 区域包含一个字�W�串��|��q�不要求采用更结构化的信息�?/p>
清单 1 昄��了结构化�?XSD 格式的文件中包含的所有购买订单信息�?/p>
清单 1. PO.xsd

�q�可以��用统一建模语言�Q�Unified Modeling Language�Q�UML�Q�类关系图来对购买订单信息进行结构化�Q�如�?2 中所�C��?/p>
�?2. 购买订单�?UML �c�d��p�d��

XSD po.xsd 文�g和该 UML �c�d��p�d��h��以下区别�Q?/p>

�c�d��p�d��定义�?ItemType�Q�而�ƈ未在 po.xsd.diagram 中定义此��V��尽��?po.xsd �q�不具体定义 ItemType�Q�XSD 规范仍可��?ItemType 作�ؓ匿名�c�d��处理�?

XSD 中所�?xsd: 在类关系图中都羃写�ؓ�?。在 XSD 中，xsd: 模式中的 xsd 用于指示�c�d��所属的命名�I�间。在�c�d��p�d��中，��Z��单�v见而将其省略了�?

SKU type 未在�c�d��p�d��中定义�?code>SKU type 事实上是�?po 命名�I�间中定义的规范化字�W�串�c�d��。在�c�d��p�d��中，它由 string type 加以表示�?

回页�?/font>

创徏 XML 格式的示�?PO

清单 2 中所�C�的�C�Z�� CreatePurchaseOrder.java �E�序用于创徏一�?PO�Q�该 PO 采用名�ؓ po.xml �?XML 格式�Q�如清单 3 所�C�）�?/p>
清单 2. CreatePurchaseOrder.java

/** * Author: Fuhwei Lwo */ import java.io.FileOutputStream; import java.io.FileInputStream; import java.io.OutputStream; import commonj.sdo.DataObject; import commonj.sdo.helper.DataFactory; import commonj.sdo.helper.XMLHelper; import commonj.sdo.helper.XSDHelper; public class CreatePurchaseOrder { private static final String PO_MODEL = "po.xsd"; private static final String PO_NAMESPACE = "http://www.example.com/PO"; private static final String PO_XML = "po.xml"; private static void definePOTypes() throws Exception { FileInputStream fis = new FileInputStream(PO_MODEL); XSDHelper.INSTANCE.define(fis, null); fis.close(); } public static void main(String[] args) throws Exception { definePOTypes(); DataObject purchaseOrder = DataFactory.INSTANCE.create(PO_NAMESPACE, "PurchaseOrderType"); purchaseOrder.setString("orderDate", "1999-10-20"); DataObject shipTo = purchaseOrder.createDataObject("shipTo"); shipTo.set("country", "US"); shipTo.set("name", "Alice Smith"); shipTo.set("street", "123 Maple Street"); shipTo.set("city", "Mill Valley"); shipTo.set("state", "CA"); shipTo.setString("zip", "90952"); DataObject billTo = purchaseOrder.createDataObject("billTo"); billTo.set("country", "US"); billTo.set("name", "Robert Smith"); billTo.set("street", "8 Oak Avenue"); billTo.set("city", "Mill Valley"); billTo.set("state", "PA"); billTo.setString("zip", "95819"); purchaseOrder.set("comment", "Hurry, my lawn is going wild!"); DataObject items = purchaseOrder.createDataObject("items"); DataObject item1 = items.createDataObject("item"); item1.set("partNum", "872-AA"); item1.set("productName", "Lawnmower"); item1.setInt("quantity", 1); item1.setString("USPrice", "148.95"); item1.set("comment", "Confirm this is electric"); DataObject item2 = items.createDataObject("item"); item2.set("partNum", "926-AA"); item2.set("productName", "Baby Monitor"); iteim2.setInt("quantity", 1); item2.setString("USPrice", "39.98"); item2.setString("shipDate", "1999-05-21"); OutputStream stream = new FileOutputStream(PO_XML); XMLHelper.INSTANCE.save(purchaseOrder, PO_NAMESPACE, "purchaseOrder", stream); } }

清单 3. Po.xml

Alice Smith 123 Maple Street Mill Valley CA 90952 Robert Smith 8 Oak Avenue Mill Valley PA 95819 Hurry, my lawn is going wild! Lawnmower 1 148.95 Confirm this is electric Baby Monitor 1 39.98 1999-05-21

该示�?Java �E�序首先通过调用 XSDHelper.INSTANCE.define() �Ҏ��?SDO �q�行时注�?po.xsd 中描�q�的所有类型。然后，它从 PurchaseOrderType 创徏一个根 DataObject。该�E�序��从该处使用 DataObject API 来构�?DataObject 树，以表�C��买订单信息，如图 3 中所�C��?/p>
�?3. DataObject �?/b>

在图 3 中，每个矩�Ş都划分�ؓ两个隔间。顶部间隔（灰色�Q�指�C?DataObject 实例名称及其实际�c�d��Q�底部间隔指�C�所包含的属性。例如，树的根元素�ؓ purchaseOrder DataObject 实例�Q�其实际�c�d��?PurchaseOrderType�Q�在清单 1 中的 PO.xsd 中定义。在�?DataObject 实例中，包含两个属性值—�?code>orderDate �?comment�?/p>
创徏 DataObject 树后�Q�该�E�序调用 XMLHelper.INSTANCE.save() �Ҏ��来将�?purchaseOrder DataObject 实例开始的树内容保存到 XML 文档中（此例中�ؓ po.xml�Q�。事实上�Q�可以将树中��M�� DataObject 实例指定�?XMLHelper.INSTANCE.save() �Ҏ��的第一个参敎ͼ�save() �Ҏ��保存从所指定的实例开始的所�?DataObject 实例�?/p>

回页�?/font>

��d��C�Z�� PO

CreatePurchaseOrder.java 创徏�?po.xml 后，我们可以�~�译�q�运行清�?4 中所�C�的 ReadPurchaseOrder.java�Q�以演示如何使用 SDO API 来遍�?po.xml 的内宏V��该应用�E�序��执行以下操作：

�q�行��查，以确保已�?SDO �q�行时注册了 po.xsd 中定义的�c�d��

调用 XMLHelper.load() �Ҏ��来将 po.xml 加蝲到内存中�Q��?XMLDocument 实例 xmlDoc 加以表示�Q?

调用 xmlDoc.getRootObject() �Ҏ��来检索名�?purchaseOrder �?DataObject 树的根对象，该对象与�?3 中所�C�的 DataObject 树关�p�d��中的 purchaseOrder DataObject 对应

purchaseOrder DataObject �q�回后，遍历 DataObject 树，以检索关于此 PO 的所有信�?

清单 4. ReadPurchaseOrder.java

/** /** * Author: Fuhwei Lwo */ import java.io.FileInputStream; import java.util.List; import commonj.sdo.DataObject; import commonj.sdo.helper.XMLDocument; import commonj.sdo.helper.XMLHelper; import commonj.sdo.helper.XSDHelper; public class ReadPurchaseOrder { private static final String PO_MODEL = "po.xsd"; private static final String PO_XML = "po.xml"; private static void definePOTypes() throws Exception { FileInputStream fis = new FileInputStream(PO_MODEL); XSDHelper.INSTANCE.define(fis, null); fis.close(); } public static void main(String[] args) throws Exception { definePOTypes(); FileInputStream fis = new FileInputStream(PO_XML); XMLDocument xmlDoc = XMLHelper.INSTANCE.load(fis); DataObject purchaseOrder = xmlDoc.getRootObject(); System.out.println("Order date: " + purchaseOrder.get("orderDate")); System.out.println("Comment: " + purchaseOrder.get("comment")); DataObject shipTo = purchaseOrder.getDataObject("shipTo"); System.out.println("Ship to name: " + shipTo.get("name")); DataObject billTo = purchaseOrder.getDataObject("billTo"); System.out.println("Bill to name: " + billTo.get("name")); System.out.println(); DataObject items = purchaseOrder.getDataObject("items"); List itemList = items.getList("item"); for (int i=0; i

清单 4 中以黑体昄��?System.out.println() 昄��各种数据对象的属性��|��包括�Q?/p>

purchaseOrder DataObject �?orderDate �?comment 属�?

shipTo DataObject �?name 属�?

billTo DataObject �?name 属�?

各种数据对象�?partNum �?productName 属�?

�?4. �q�行 ReadPurchaseOrder 的控制台输出

Order date: 1999-10-20
Comment:Hurry, my lawn is going wild!
Ship to name:Alice Smith
Bill to name:Robert Smith
Part num:872-AA
Product name:Lawnmower
Part num:926-AA
Product name:Baby monitor

在图 4 中，我们可以看到�q�行 ReadPurchaseOrder Java 代码的输出�?/p>

回页�?/font>

�l�束语：SDO ��成��Z��实上的数据模型编�E?API

SDO 2.0 API 提供了创建和讉K��数据的一致方式，使开发�h员不必了解分析和�l�护数据完整性的底层实现�l�节。SDO 2.0 目前�?Apache Software Foundation 下的一个试验性子��目�Q�称�?Tuscany�Q�，预期��成�?SOA 开发的数据模型�~�程 API 的事实标准。请参阅参考资�?/font>部分�Q�以获得一个相关链接�?/p>
可以从上面的�C�Z��中看出，SDO 2.0 API 使您完全不必知道和��?XML 解析�?API 来读取、写入和操作数据。如果��?Java 创徏�?DataObject 来表�C�符合您所定义�?XML 模式�?XML 数据�Q�SDO 2.0 ��提供��够的方便性和灉|��性，让您��精力放在如何��用数据上。因此，它可为您带来极大的好处，从而提高开发工作效率和产品质量�?/p>
��M��Q�通过使用 SDO 2.0 提供的数据抽象技术，您可以根据所定义的业务逻辑来处理数据，以满��x��的业务需求。这可以帮助您简化业务应用程序开发，也能提高团队的工作效率和工作质量�?/p>

回页�?/font>

参考资�?
学习

您可以参阅本文在 developerWorks 全球站点上的英文原文 �?br />

请参�?W3 �|�站上的 XML Schema Part 0:Primer Second Edition�Q�以了解 XML 模式机制的说明，�q�了解如何��?XML 模式语言创徏模式�?br />

请参�?Service Data Objects 规范�?br />

�?Apache Software Foundation �|�站了解有关 Tuscany/SDO 2.0 project 的更多信息�?br />

误��?SOA and Web services 专区�Q�以获得数百��关于如何开�?Web 服务应用�E�序的文章以及入门��、中�U�和高��教程�Q�您��大开眼界�?/li>

讨论

developerWorks 博客 ——参�?developerWorks �C�֌��?br />

回页�?/font>

关于作�?/font>

Fuhwei Lwo 目前�?WebSphere Service Data Objects (SDO) 的团队负责�h。他主要的工作重�Ҏ��推动在面向服务的体系�l�构�Q�Service Oriented Architecture�Q�SOA�Q�中��?SDO 作�ؓ数据数据模型�~�程 API 成功采用�?/p>

草儿 2007-01-12 09:42 发表评论

草儿 — Wed, 03 Jan 2007 13:20:00 GMT

                                                            �?�?�?br />                             MG0133041
                            南京大学计算机科学与技术系分布式与�q�行�pȝ��实验�?br />                             江苏南京 210093
�?�?/strong>��Z��WEB 的数据挖掘是当前相当热门的方向之一本文�Ҏ��作了一个比较全面的
�l�D��概括了基于WEB 的数据挖掘的主要概念和特点说明各�c�WEB 挖掘��其
是基于WEB 使用的挖掘所常用的技术最后简单介�l�了XML 在基于WEB 数据
挖掘中的应用
关键�?/strong>��Z��WEB 的数据挖�?��Z��WEB 使用的数据挖�?半结构化 XML

Abstract: As web mining is one of the hottest research fields presently, this survey introduces itsbasic concepts and characteristics, including semi-structured data model. Three types ofweb mining and their applications are discussed in this paper, especially the web usagemining. Using XML in web mining is also stated in the last of the article.
Keywords: Web Mining Web Usage Mining Semi-structured XML

       我们现在已经生活在一个相当数字化的时代中,通信、计��机和网�l�技术正极大地媄响着整个人类�C�会。然而，��量信息既给��Z��带来方便也带来了许多问题使我们惊叹信息爆炸的同时�Q�又不得不面对知识��乏的苦恼信息�q�量难以消化信息真假难以辨别�Q�信息安全难以保证，信息形式相异难以�l�一处理。�h们开始考虑�Q�“如何才能不被信息��没，而是从中及时发现有用的知识、提高信息利用率。”面对这一挑战�Q�数据挖掘技术应�q�而生�Q��ƈ得到长��的发展，昄��Z��强大的生命力.
        所谓数据挖掘Data Mining ��是从大量的、不完全的、有噪声的、模�p�的、随机的原始数据中提取隐含在其中的、事先未知的、但又是潜在有用的信息和知识的过�E�[1] 。数据挖掘的诞生是�h们对数据库技术进行长期研�I�和开发的�l�果�Q�而数据挖掘技术发展的同时它又反过来促使数据库技术进入了一个更高��的阶�D�：传统的数据环境基本上是数据操作型的传�l�的信息�pȝ��只负责数据的增删及修�Ҏ��作而在数据库的基础上可实现的工作就是OLTP �Q�OnLine Transaction Process 联机事务处理�Q�。现在由于数据积累的不断增多�Q��h们需要分析型的数据环境，于是��出��C��由数据库导出的数据仓库，以此为基��则可以实现OLAP �Q�OnLine Analysis Process 联机分析处理�Q�：随着��量数据搜集的可能计��机处理技术的增强和先�q�数据挖掘算法的提出�Q�数据挖掘技术不仅能对过�ȝ��数据�q�行查询和遍历，而且能够扑և��q�去数据之间潜在有�h值的联系�q�以一定的形式表现出来�Q�从而极大的满��了�h们对知识的迫切需求�?br />        数据挖掘��Z��的原始数据是形成知识的源泉，它既可以是结构化的如关系数据库中的数据，也可以是半结构化的，如文本、图形、图像数据，甚至是分布在�|�络上的异构型数据。本文将着重讨��Z��U�针对半�l�构化数据的挖掘—基于WEB 的数据挖掘，主要介绍了它的基本概念以及经帔R��用的技术最后简单说明了XML 在其中的应用�?br />一�?��Z��WEB 的数据挖掘的主要概念
1�?什么是��Z��WEB 的数据挖�?br />        当前�|�络发展�q�速，各种�|�站比比皆是。但在竞争日益激烈的�|�络�l�济中，只有赢得用户�Q�才能最�l�赢得竞争的优势。作��Z��个网站的��理员或拥有者，应该知道用户都在他的�|�站上干什么，知道�|�站哪些部分最为用户喜爱，哪些让用��h��到厌烦，什么地方出了安全漏�z�，什么样的改动带来了显著的用��h��意度�Q�提高什么样的改动反而丢�׃��用户�{�等。“知��q��彼”，才能“百战不�D�”。而基于WEB 数据挖掘技术正能满��些需求�?br />        ��基于WEB 数据挖掘的确切定义，到目前�ؓ止还没有很明��而权威的说法。国外有认�ؓ�Q�基于WEB 数据挖掘�Q�就是利用数据挖掘技术自动地从网�l�文档以及服务中发现和抽取信息的�q�程。国内则众说�U�L��Q�有认�ؓ是在大量已知数据��h��的基��上得到数据对象间的内在特性，�q�以此�ؓ依据在WEB 中进行有目的的信息提取过�E�。同�Ӟ��也有学者将�|�络环境下的数据挖掘归入�|�络信息��索与�|�络信息内容的开发等�{�。��M��Q�基于WEB 的数据挖掘（Web Mining�Q?正是从万�l�网�Q�World Wide Web �Q�上获取原始数据中从中挖掘出隐含其中且潜在可用的知识最�l�应用于商业�q�作以满��管理者的需要�?br />2 、基于WEB 数据挖掘的分�c?br />�Ҏ��挖掘的对象不同我们可以把��Z��WEB 的数据挖掘分��Z��大类�Q?br /> 􀁺��Z��WEB 内容的挖掘（Web Content Mining�Q?br />􀁺 ��Z��WEB �l�构的挖掘（Web Structure Mining�Q?br />􀁺 ��Z��WEB 使用的挖掘（Web Usage Mining�Q?br />�Q?�Q�基于WEB 内容的挖�?br />        所谓基于WEB 内容的挖掘实际上��是从WEB 文档及其描述中获取知�? WEB 文档文�g挖掘以及��Z��概念索引或Agent 技术的资源搜烦也应该归于此�c�R��Web 信息资源�c�d��众多�Q�目前WWW 信息资源已经成�ؓ�|�络信息资源的主体，然而除了大量的��Z��可以直接从网上抓取、徏立烦引、实现查询服务的资源之外�Q�相当一部分信息是隐藏着的数据（如由用户的提问而动态生成的�l�果�Q�存在于数据库系�l�中的数据，或是某些�U��h数据�Q�无法被索引�Q�从而无法提供对它们有效的检索方式，�q�就�q��我们把这些内�Ҏ��掘出来。若从信息资源的表现形式来看�Q�WEB 信息内容是由文本、图像、音频、视频、元数据�{�种�U��Ş式的数据�l�成的，因而我们所说的��Z��WEB 内容的挖掘也是一�U�针对多媒体数据的挖掘�?br />2 、基于WEB �l�构的挖�?br />       �q�一�c�d��的挖掘是从万�l�网的整体结构和�|�页上的�怺�链接中发现知识的�q�程�Q�它主要挖掘WEB 潜在的链接结构模式。这�U�思想源于引文分析�Q�即通过分析一个网��链接和被链接数量以及对象来建立WEB 自��n的链接结构模式。这�U�模式可以用于网��归�c�dƈ且可以由此获得有关不同网��间�怼�度及兌��度的信息。WEB �l�构挖掘有助于用��h��到相关主题的权威站点�Q�而且对网�l�资源检索结果的排序有很大意义�?br />3�?��Z��WEB 使用的挖�?br />        ��Z��WEB 使用的挖掘，也称为WEB 日志挖掘�Q�Web Log Mining�Q�。与前两�U�挖掘方式以�|�上的原始数据�ؓ挖掘对象不同�Q�基于WEB 使用的挖掘面对的是在用户和网�l�交互的�q�程中抽取出来的�W�二手数据。这些数据包括：�|�络服务器访问记录、代理服务器日志记录、用��h��册信息以及用戯��问网站时的行为动作等�{�。WEB 使用挖掘��这些数据一一�U�录到日志文件中�Q�然后对�U�篏��h��的日志文件进行挖掘，从而了解用��L��|�络行�ؓ数据所��h��的意义。我们前面所丄��例子正属于这一�U�类型�?br />        �?[2]从五个方面对三种挖掘形式做了比较其中的具体内容下文将会作�q�一步介�l��?br />          ��Z��WEB 内容的挖掘：非结构化半结构化\文本文档 ��文本文档\Bag of words n-grams 词短�?概念或实�?关系型数据\TFIDF 和变体机器学习统计学(包括自然语言处理)\归类聚类发掘抽取规则发掘文本模式建立模式.
           ��Z��WEB �l�构的挖�?半结构化数据库�Ş式的�|�站链接�l�构\��文�?文档链接\边界标志�?OEM 关系型数�?囑�Ş\Proprietary ��法 ILP (修改�?的关联规则\发掘高频的子�l�构发掘�|�站体系�l�构归类聚类.
          ��Z��WEB 使用的挖�?交互形式\服务器日志记�?��览器日志记录\关系型表囑�Ş\Proprietary ��法机器学习 �l�计�?(修改后的�Q�关联规则\站点�� 改进与管�?销建立用户模式.
3�?��Z��WEB 数据挖掘的特�?/strong>
�Q?�Q?、什么是半结构化
       所谓半�l�构化是相对于结构化和非�l�构化而言的。我们称传统数据库中的数据�ؓ完全�l�构化的数据�Q�而同时还存在着一些诸如一本书、一张图片等完全无结构的非结构化数据。半�l�构化则是介于两者之��_��h��隐含模式、信息结构不规则、无严格�c�d��U�束�{�特炏V��半�l�构化数据模式有如下特征[4]
      先有数据�Q�后有模式；
      半结构化数据的模式是用于描述数据的结构信息，而不是对数据�l�构�q�行强制性的�U�束�Q?br />     半结构化数据的模式是非精��的�Q�它只可能描�q�数据的一部分�l�构�Q�也可能�Ҏ��数据处理的不同阶�D늚�视角不同而异�Q?br />     半结构化数据的模式，可能规模很大甚至��过源数据的规模�Q�而且会由于数据的不断更新而处于动态变化过�E�中�?br />�Q?�Q��?WEB 数据的特�?br />        Web 上的数据最大特点就是半�l�构化。但是Web 上的数据与传�l�的数据库中的数据不同，传统的数据库都有一定的数据模型�Q�可以根据模型来具体描述特定的数据而且按照一定的�l�织有规律的集中或者分布存放，�l�构性很强；而Web 上的数据非常复杂�Q�没有特定的模型描述每一站点的数据，都各自独立设计�ƈ且数据本�w�具有自�q�性和动态可变性，因而Web 上的数据不是强结构性的。但与此同时Web ��面又是有描�q�层�ơ的�Q�单个网站也是按照各自的�l�构构架的，从而具有一定的�l�构性。因此我们认为Web 上存在的数据既不是完全结构化的也不是完全非结构化的，而是介于两者之��_��一般称之�ؓ半结构化数据�?br />        半结构化是Web 上数据的最大特点，昄��面向Web 的数据挖掘比面向单个数据仓库或者其他结构化数据集的数据挖掘要复杂得多�?br />4、��用基于WEB 数据挖掘能得��C��?br />        Web Mining 技术已�l�应用于解决多方面的问题�Q�比如基于WEB 内容和结构的挖掘极大的帮助了我们从浩瀚的�|�络资源中更加快速而准��的获取所需要的资料�Q�而基于��用的数据挖掘之威力，更是在商业运作上发挥的淋漓尽��_��具体表现在：
�Q?�Q?对网站的修改能有目的有依据稳步的提高用户满意�?br />发现�pȝ��性能瓉��Q�找到安全漏�z�，查看�|�站��量模式�Q�找到网站最重要的部分，发现用户的需要和兴趣�Q�对需求强烈的地方提供优化�Q�根据用戯��问模式修改网��之间的�q�接�Q�把用户惌��的东西以更快且有效的方式提供�l�用��P��在正��的地方正确的时间把正确的信息提供给正确的�h�?br />�Q?�Q?��定投资回报�?br />      ��定�q�告和促销计划的成功度
      扑ֈ�最有�h值的ISP 和搜索引�?br />      ��定合作和结盟网站对自��n的�h�?br />�Q?�Q?提供个性化�|�站
          对大多数WEB 应用来说�Q�让用户感到真个�|�站是完全�ؓ他自己定制的个性化�|�站�Q�是WEB 站点成功的秘诀。针对不同的用户完全按照其个人的兴趣和爱好（数据挖掘��法得到的用戯��问模式）向用户动态的提供要浏览的��自动提供个性化的网站�?br />        下面我们��就��Z��WEB 使用的挖掘，�q�一步讨论它所�l�常采用的技术�?br />二、基于WEB 使用挖掘中的技术问�?br />1�?Web Usage Mining 中非技术问�?br />       在基于��用的挖掘中，��Z��商业目的考量�|�站的拥有者或者管理者经�怼�对网站的某些斚w��提出一些分析，比如�Q�流量分析（点击量）、广告分析、网站出入口分析、访问�\径分析、用��h��源分析、浏览器和��^台分析等�{��?br />       ��p��些方面作�q�一步的��分析�Q�我们可以从中真正与数据挖掘相关的问题：
�Q?�Q?�|�页相关性分�?br />       哪些�|�页��h��密切的关�p�，如果很多人具有a.html-〉b.html-〉c.html �q�样的访问模式，则我们可以认定a.html 和c.html 之间有一定的关系�Q�从而考虑是否在a.html 上直接加上c.html的链接�?br />�Q?�Q?用户讉K��模式分析
        有哪一些网��는�户只要访问了其中的一��，则可以断定他也要讉K��其他的网��即按不同的用户讉K��模式�Q�把�|�页分组得到一个一个的兴趣炏V��哪些用��h��讉K��的网��늻�成比较类��|��h��c�M��的兴��）��x��据用戯��为的�怼�性，把用��h��行�ؓ模式分类�?br />�Q?�Q?用户归类
通过用户填写的信息如何把用户归入某一特定的类别，然后可对同一�c�d��中的用户提供�怼�的服务�?br />2 、Web Usage Mining 中的技术问�?br />�Q?�Q?数据处理
         如何得到分析和数据挖掘所用的数据�Q�主要采用两�U�方法，一是直接��用Web Server的Log 文�g�Q�二是用�|�络监听的办法，在数据包中提取出HTTP ��h��和应�{�。最后两�U�数据源都要转换成固定的格式存放在数据库或数据仓库内�Q�供�l�计分析和数据挖掘��用�?br />�Q?�Q?�l�计分析
          在数据库的基��上，针对不同的数据运行各�U�统计函数�?br />�Q?�Q?数据挖掘
           数据挖掘技术是实现��分析得到隐藏在大量繁杂数据内部知识的关键。通过对用戯��问网站的历史数据(��x��们通过数据处理得到的数�?应用各种数据挖掘技�?得到高层知识�Q�提供给用户作决�{�支持，或利用这些知识动态生成网��，为用��h��供访问徏议�?br />�Q?�Q?兌��规则Association Rules
         从服务器会话中发现请求网��늚�相关性，可用于优化网站组�l�，实现�|�络代理中的预取功能�{��?br />�Q?�Q?聚集Clustering
         使用分组�Q�Usage Clusters �Q�把��h��怼��览模式的用户分成组�Q�可用于电子商务应用中市场分片（market segmentation�Q?和�ؓ用户提供个性化服务�Q�而网��分�l�（page clusters �Q�按内容的相似性把�|�页分类�Q�可用于搜烦引擎和Web ��览助手�Q�Web assistance providers �Q��ؓ用户提供推荐链接�?br />�Q?�Q?归类Classification
          �Ҏ��用户的个��料，��其归入某一特定的类�Q�可使用决策树、naive Bayesian
classifiers�?k-最�q�邻居等��法�?br />�Q?�Q?序列模式Sequential Patterns
        发现一个session 内部的网��间的时间相��x��，可用于预��用��L��讉K��向而提供徏议�?br />三、XML 技术在��Z��WEB 的数据挖掘中的应�?br />1 、XML 技术简�?br />        XML �Q�eXtsible Markup Language�Q?是SGML �Q�Standard General MarkupLanguage �Q�的一个子集，�q�年来�ؓIBM Microsoft �{�公司大力推崇。和HTML�Q?Hyper Text Markup Language�Q�类��|��XML 也是一�U�标�C��a��Q�可提供描述�l�构化资料的格式�Q�它们都可以用于可视化和用户界面标准�?br />       当前�Q�Internet 只是文本和图片的讉K��媒体�Q��ƈ没有��搜烦、数据交换、自适应表示和个人化的标准。�ؓ了超��|�信息访问和昄��标准的限�Ӟ��Internet 必须讄��信息理解标准�Q�表�C�数据的通用方式�Q�以便��Y件能够更好地搜烦�U�d��昄��和处理上下文中隐藏的信息。由�?HTML 是一�U�描�q�如何表�C?WEB ��늚�格式�Q��ƈ不表�C�数据，所以它�q�不能完成以上处理。�?XML 提供了一�U�独立的�q�行�E�序的方法来�׃�n数据是用来自动描�q�C��息的一�U�新的标准语�a��Q�它通过计算机通信“把Internet 的功能由信息传递扩大到人类其他多种多样的活动中厠Z��[3]�?br />2、技术的特点及其在Web Mining 中的应用
       它最大的特点在于其Tag 是具有语义的�Q�可��q��户定义能够反映一定的数据的含义。此外，XML �q�具有简单易用、可扩展性、开发性、强标准化等特点,非常适合应用于WebMining 。从某种意义上说�Q�XML 非常接近半结构化的数据模型它可供操作的基��要比HTML 好得多。图二是HTML 和XML 的文档比较，我们不难看出XML 的文档描�q�的语义非常清楚�Q�而且我们很容易就可以��之和关�p�L��据库中的属性一一对应��h��Q�能够支持实施十分精��的查询�Q�以及其他高�U�操作。而HTML 文档只是按显�C�方式进行描�q�的。由此可见，XML ��ؓ在WEB 上的数据查询和模式抽取提供了一个重要的契机�?br />       XML ��p��q�规则组成，�q�些规则可用于创建标记语�a��Q��ƈ能用一�U�被�U�C��分析�E�序的简明程序处理所有新创徏的标记语�a�。XML 解决了HTML 不能解决的两个Web 问题�Q�即“Internet 发展速度快而接入速度慢”的问题�Q�以及可利用的信息多但难以找到自己需要的那部分信息”的问题[3]�?XML 能增加结构和语义信息可��计算机和服务器即时处理多�U��Ş式的信息。因此，�q�用XML 的扩展功能不仅能从WEB 服务器下载大量的信息�Q�还能大大减��网�l�业务量�?br />        以XML 为基��的新一代WWW 环境是直接面对WEB 数据的，不仅可以很好地兼容原有的WEB 应用而且可以更好地实现WEB 中的信息�׃�n与交换。XML 可看作一�U�半�l�构化的数据模型�Q�可以很�Ҏ��地将XML 的文档描�q�C��关系数据库中的属性一一对应��h��Q�实施精��地查询与模型抽取�?br />         当用标准的HTML 无法完成某些WEB 应用�Ӟ��XML 便能大显�w�手�q�些应用从大的方面讲可以被分成以下四�c�：需要WEB 客户端在两个或更多异质数据库之间�q�行通信的应用；试图��大部分处理负蝲从WEB 服务器�{到WEB 客户端的应用�Q�需要WEB 客户端将同样的数据以不同的浏览�Ş式提供给不同的用��L��应用�Q�需要智能WEB 代理�Ҏ��个�h用户的需要裁减信息内容的应用。显而易见，�q�些应用和WEB 的数据挖掘技术有着重要的联�p�，��Z��WEB 的数据挖掘必��M��靠它们来实现�?br />四、一些著名的Web Mining 产品��?br />1、Net percerptions
       Net Perceotion 公司的Net Percerptions �Q�采用了一个叫做实时徏议的技术：让它的��品对象（主要是网站）能够�Ҏ��用户以往的浏览行�?比如以前的购买记�? 在其他用��P��U�做Community 中）扑և�与他有相�c�M��览行�ؓ的，�Ҏ��q�些用户的浏览行为来预测该用户以后的��览行�ؓ�Q�从而�ؓ用户提供个性化的浏览徏议。这�U�技术利用了�|�站用户的浏览行为有�怼�的一面，因此光��a�有很高的准确性。�ƈ且它是实时运行的�Q�随着��览量的增加会变得越来越聪明�?br />2�?CommerceTrends
        WebTrends 公司的CommerceTrends 被宣�U�Cؓ�W�一个用于VRM �Q�Visitor Relationship Management�Q?的��^収ͼ�它能够让电子商务�|�站更好地理解其�|�站讉K��者的行�ؓ�Q�帮助网站采取一些行动来��这些访问者变为顾客，��一�ơ性的��֮�变�ؓ长期的忠实顾客。 CommerceTrends 提供了完全的“browser-based�?�Ҏ��Q��得不同的部门�Q�从市场部门到分析家�Q�能在�Q何时间得��C��所惛_��到的个性化报表。同时它�q�利用了强大的数据仓库技术，�q�样��׃��仅仅��原始数据存在数据库里而是“Sessionizes ”了原始数据�?br />3. DBMiner
        加拿大Simon Fraser 大学数据库系�l�研�I�实验室Database SystemResearchLaboratory
的知识发现研�I�组在数据挖掘技术领域经�q�多�q�的研究开发了名�ؓDBMiner 的知识发现系�l�原型。它��机器学习方法学和数据库技术结合�v来，用于在大型数据库和数据仓库中交互地挖掘多层次的知识。该�pȝ��独特之处在于紧密集成了联机分析处理OLAP 和多�U�数据挖掘功能，包括特征化、关联、分�c�d��聚类�?br />�?�l�束�?br />          ��Z��WEB 的数据挖掘是当前热门研究方向之一�Q�而且其应用范畴广阔，潜力巨大�Q�Web Mining 技术也在不断提出和改进之中。但是Web Mining 技术还有很多缺陷和不��。我们还需要半�l�构化数据模型、Web 数据的过滤和转换�{�方面作�q�一步研�IӞ��才能�q�一步发挥Web Mining 的无限威�?br />
References
[1] Jiawei Han and Micheline Kamber Data Mining: Concepts and Techniques 2000 Morgan
Kaufmann Publishers
[2] �?�?��谈�|�络信息挖掘
[3] 徐振�?刘莉�?XML 与面向Web 的数据挖掘技�?br />[4] �?�?孟小�?半结构化数据的模式研�I�综�q?计算机科�?2001 Vol. 28
[5] �?�?数据挖掘走向Internet 微电脑世�?br />[6] 王聪�?�|�络数据挖掘
[7] What is Web Mining Lily BBS
[8] 李志�?�|�页数据分析天极�|?2001.2
[9] Web Mining: �W�二代网�l�信息处理技�?Lily BBS
[10] 构造未来Web ��面的工兯��a�XML Lily BBS

草儿 2007-01-03 21:20 发表评论

COGNOS业务��产品

草儿 — Wed, 03 Jan 2007 11:41:00 GMT
     摘要: 一、     �? Cognos 业务��服务的主要��? 使用 Cognos ...  阅读全文

草儿 2007-01-03 19:41 发表评论

草儿 — Mon, 01 Jan 2007 07:25:00 GMT
     摘要: 聚类分析和判别分析有�怼�的作用，都是起到分类的作用。但是，判别分析是已知分�cȝ��后�ȝ��出判别规则，是一�U�有指导的学习；而聚�c�d��析则是有了一�Ҏ��本，不知道它们的分类�Q�甚臌��分成几类也不知道�Q�希望用某种�Ҏ��把观��进行合理的分类�Q��得同一�cȝ��观测比较接近�Q�不同类的观��相差较多，�q�是无指导的学习�? 所以，聚类分析依赖于对观测间的接近�E�度�Q�距��）或相似程度的理解�Q�定义不同的距离量度�?..  阅读全文

草儿 2007-01-01 15:25 发表评论

SPSS �l�计软�g的主菜单及子菜单

草儿 — Mon, 01 Jan 2007 07:22:00 GMT
     摘要: 菜单 ...  阅读全文

草儿 2007-01-01 15:22 发表评论

Web信息抽取技术纵览二

草儿 — Mon, 01 Jan 2007 07:19:00 GMT
     摘要: �W�六�?          �ȝ��和讨�? ...  阅读全文

草儿 2007-01-01 15:19 发表评论

Web信息抽取技术纵览一

草儿 — Mon, 01 Jan 2007 07:18:00 GMT
     摘要: �W�一�?          ��D�� ...  阅读全文

草儿 2007-01-01 15:18 发表评论

草儿 — Mon, 01 Jan 2007 07:14:00 GMT
     摘要: Introduction Cluster analysis is the process of grouping objects into subsets that have meaning in the cont...  阅读全文

草儿 2007-01-01 15:14 发表评论

草儿 — Mon, 01 Jan 2007 07:10:00 GMT

�Q?�Q�什么是�l�D��Q?
文献�l�D��是以作者非直接�l�验和资料�ؓ主而�Ş成的一�U�论文。它是将一定时期内某一学科领域或专题的文献攉��h��Q�对其提出和探讨的问题进行分析归�U�뀁综合评论、加工整理而成。培��d��掌握文献�l�D��的写作能力和�Ҏ��Q�是一名科研工作者必��d��备的一��基本功�?br />�Q?�Q�综�q�的作用?
服务�?
研究�?
文献��索回�?
�Q?�Q�综�q�的�c�d��?
按时间划分：回顾�?�l�D��、前��L��综�q?
按是否参与作者个人意见划分：归纳性综�q�、评论性综�q?
按内容划分：动态性综�q�、成��性综�q�、争鸣性综�q�W?
�Q?�Q�文献综�q�的特点?
新颖�?�l�合�?评述�?客观�?
�Q?�Q�综�q�的格式?
题名
�|�名和单�?br />摘要和关键词
引言
��M��
�l�束�?br />致谢
参考文�?br />�Q?�Q�题名的作用?
提示作用
评�h作用
吸引作用
��索作�?
�Q?�Q�题名的基本要求 :具体��切�Q�表辑־��?��短精�l�，高度概括用词规范�Q�可供检�?br />�Q?�Q��v名和单位:姓名在前�Q�单位名�U�在后；
姓名在上行，单位名称在下行；
单位在前�Q�姓名在后；
单位名称在上行，姓名在下行；
题名下只写作者姓名，单位名称以脚注的形式攑֜�首页的脚注�?br />�Q?�Q�摘要和关键�?�Ҏ��国家标准规定�Q�文献综�q�和其他论文一��P��都应有摘要，�q�列�?~5个关键词�?br />�Q?0�Q�摘要的�c�d��:
报道性摘要又�U�资料性摘要，是指明一�ơ文献的主题范围及内�Ҏ��概的��明摘要，相当于简介�?br />指示性摘要又�U�描�q�性摘要，指示一�ơ文献的论题及取得的成果的性质和水�q�I��不具体介�l�研�I�的�Ҏ��和结果，但是不应只简单重复题名中已有的信息，写成题名的解释说明�?br />报道--指示性摘�?�q�种摘要介于上述两种摘要之间�Q�或者说是上�q�C��U�摘要相�l�合的综合性摘�?br />�l�构性摘要按层次列出��目名称�Q�逐项分别叙述。包括：目的、材料和�Ҏ��、结果、结论�?br />�Q?1�Q�引 �a�:可用��标题“引�a�”引��|��也可不用�Q�直接写文字�?br />�Q?2�Q�内容：目的、主题、介�l�背景材料、阐明所写的范围和内容（�?~2句话表达�Q��?br />注意�Q�引�a�不宜�q�长�Q�应开门见山，100~200字即可�?br />�Q?3�Q�主    �?:是综�q�C��要内容的叙述部分
注意: 应反映不同学术观�?应列出小标题加以��* 应引用主要研�I�结果和�l�论性观�?br />�Q?4�Q�结 �?归纳��M��部分所叙述的内�?评论��M��部分所提出的问�?对今后的研究提出��或展�?br />�Q?5�Q�致 �?在撰写综�q�的�q�程�?得到某�h的指��|��或写�?后经某�h审阅�Q�需在正文末��致谢�?
�Q?6�Q�参考�?文�?�?通常是指文后参考文献。它是�ؓ撰写论文或编写著作而引用的有关书刊资料及其他特�D�资料�?br />�Q?7�Q�综 �q?�?�?�?
选题
查阅文献
阅读文献
摘录内容
��立论点
拟提�U?br />写作
�Q?8�Q��?�?�?�?�?
感觉到某问题的存在，自己有新的见解；�Ҏ��问题说法多，但较混�ؕ、互相矛盾；有新提法或假��_��但尚未�Ş成；某领域有长��的进步；�Ҏ��工作或研究的阶�D�|��综合评仗��?br />�Q?9�Q��?�?�?�?题意斊W?有��用�h值�?题目不宜�q�大
�Q?0�Q�查 �?�?�?
要求文献斎ͼ�选读3~5�q�内的期刊；
文献��索全�Q�需手捡和机捡相�l�合�Q?br />有烦引的要从��L��引查赗��?br />查阅文献的方�?��序�?回朔�?br />�Q?1�Q�阅 �?�?献：
先综�q�后单篇
先教�U�书后期�?br />先本专业后边�~�或相关学科
先摘要后全文
先目录、序�a�或内�Ҏ��要后正文
先泛��d��_�读
选取有用的内容以便写作时引用
�Q?2�Q�摘录：��定��目�Q�作者、问题、出版内宏V��刊名�?出版�q�月、卷期）、�v止页�?br />
        不定内容�Q�引�a�、材料和�Ҏ��、结果、讨��Z��的有关部分，其中最基本的是
        重要数据和核心观炏V�?br />�Q?3�Q�确 �?�?点：
   分析资料
       归纳�l�合
          �_�ֿ�推敲
                提炼论点
�Q?4�Q�拟提�?�UԌ��整理内容打腹�E?br />�Q?5�Q�写作：�Ҏ��提纲�Q�将内容展开�Q��ƈ注意观点与内容的一��_��观点�Ӟ��作者可有們֐�性，但不同观点也应列出；修改初稿�Q�誊写稿件�?br />�Q?6�Q�写 �?�?求：客观�pȝ��条理清楚�Q�说理透彻防止文献堆砌和�h名罗�?/p>

草儿 2007-01-01 15:10 发表评论

几个人工��会议(转蝲)

草儿 — Thu, 28 Dec 2006 15:05:00 GMT

IJCAI (1+): AI最好的�l�合性会�? 1969�q�开�?
每两�q�开一��? 奇数�q�开. 因�ؓAI

实在太大,
所以虽然每届基本上能录100多篇�Q�现在已�l�到200多篇了）�Q�但分到每个

领域��没几篇了，象machine learning、computer
vision�q�么大的领域每次大概�?

��?0��左�? 所以难度很�?
不过从录用率上来看倒不太低,基本�?0%左右, 因�ؓ�?

行�h都会掂掂分量, 没希望的��别��费reviewer的时间了.
最�q�中国大陆投往国际�?

议的文章象潮水一�?
而且因�ؓ国内很少有能自己把关的研�I�组,
所以很多会议都�?

complain说中国的低质量文章严重妨��了PC的工作效�?
在这�U�情况下, 估计�q�几�q?

国际会议的录用率都会降下�? 另外,
以前的IJCAI是没有poster�? 03�q�开�? ��Z��

减少被误杀的好�? 增加�?��늺�的poster.值得一提的�?
IJCAI是由貌似一个公�?

�?IJCAI Inc."��d��?当然实际上�ƈ不是公司,
实际上是个基金会), 每次会议上要

发几个奖, 其中最重要的两个是IJCAI Research Excellence
Award �?Computer

& Thoughts Award, 前者是�l��n成就�? 每次一个�h,
基本上是AI的最高奖(有趣�?

�? 以AI��Z��业拿囄��奖的6位中,
�?位还没得到这个奖), 后者是奖给35岁以下的

青年�U�学�? 每次一个�h.
�q�两个奖的获奖演说是每次IJCAI的一个重头戏.另外,

IJCAI �?PC member 相当于其他会议的area chair, 权力很大,
因�ؓ是由PC member

��L�� reviewer 来审, 而不象一般会议的PC member其实��是
reviewer. ��Z��制约

�q�种权力, IJCAI的审�E�程序是每篇文章分配2位PC member,
primary PC member��L��

3位reviewer, second PC member 找一�?

AAAI (1): ��国人工��学会AAAI的年�?
是一个很好的会议, 但其档次不稳�? �?

以给�?+, 也可以给�?-或�?+, �ȝ��来说我给�?1".
�q�是因�ؓ它的开法完全受

IJCAI制约: 每年开, 但如果这一�q�的IJCAI在北��D�?
那么��停开. 所�? 偶数�q?

里因为没有IJCAI, 它就是最好的AI�l�合性会�?
但因为号召力毕竟比IJCAI要小一�?

特别是欧�z��h捧AAAI场的比IJCAI��得�?其实亚洲��Z��?,
所以比IJCAI�q�是要稍�?

一�? 基本上在1�?+之间; 在奇数年,
如果IJCAI不在北美, AAAI自然��变成了�?

IJCAI低一�U�的会议(1-�?+), 例如2005�q�既有IJCAI又有AAAI,
两个会议��p��行了�?

�? 使得IJCAI的录用通知旉��比AAAI的deadline早那么几�?
�q�样IJCAI落选的文章

可以投往AAAI.在审�E�时IJCAI �?PC chair也在一直催,
说大家一定要�? 因�ؓAAAI

那边一直在担心IJCAI的录用通知出晚了AAAI��麻烦了.

COLT (1): �q�是计算学习理论最好的会议, ACM��d��,
每年举行. 计算学习理论基本�?

可以看成理论计算机科学和机器学习的交�?
所以这个会被一些�h看成是理��?

机科学的会而不是AI的会.
我一个朋友用一句话对它�q�行了精彩的�ȝ��:
"一��群�?

学家在开�?. 因�ؓCOLT的领域比较小,
所以每�q�会议基本上都是那些�? �q�里��Z��

提一件有��的�? 因�ؓ最�q�国内搞的会议太多太�?
而且很多会议都是LNCS/LNAI�?

论文�? LNCS/LNAI基本上已�l�被搞臭�? 但很不幸的是,
LNCS/LNAI中有一些很好的

会议, 例如COLT.

CVPR (1): 计算��觉和模式识别斚w��最好的会议之一,
IEEE��d��, 每年举行. 虽然�?

目上有计��机视觉,
但个��为它的模式识别味道更重一�?
事实上它应该是模式识

别最好的会议, 而在计算��觉方�?
�q�有ICCV与之相当. IEEE一直有个們֐�, 要把

会办�?盛会",
历史上已�l�有些会被它从quality很好的会办成"盛会"�?
CVPR搞不�?

也要走这条�\. �q�几�q�录的文章已�l�不��了.
最�q�负责CVPR会议的TC的chair发信

�? 对这个community来说,
让好��误杀比被坏�h漏网更糟�p?
所以我们是不是要减

��好��误杀的机会啊?
所以我估计明年或者后�q�的CVPR��p��扩招�?

ICCV (1): 介绍CVPR的时候说�q�了,
计算��觉方面最好的会之一. IEEE��d��.

ICCV逢奇数年开�Q�开会地点以往是北��，�Ƨ洲和亚�z�轮��，本来2003�q�定在北

京，后来因Sars和原�?5�q�的法国换了一下。ICCV'07�q�将首次在南��?巴西)举行.

CVPR原则上每�q�在北美开,
如果那年正好ICCV在北��?则该�q�没有CVPR.

ICML (1): 机器学习斚w��最好的会议之一. 现在是IMLS��d��,
每年举行. 参见关于NIPS�?

介绍.

NIPS (1): ��经计算斚w��最好的会议之一, NIPS��d��,
每年举行. 值得注意的是, �q�个�?

每年的�D办地都是一��L��, 以前是美国丹�?
现在是加拿大温哥�? 而且它是�q�底开�?

会开完后�W?�q�才��文集, 也就是说,
NIPS'05的论文集�?6�q�出. 会议的名字是

"Advances in Neural Inxxxxation Processing Systems", 所�?
与ICMLECML�q�样

�?标准�?机器学习会议不同,
NIPS里有相当一部分��经�U�学的内�? 和机器学习有

一定的距离. 但由于会议的��M��内容是机器学�?
或者说与机器学习关�pȝ��? 所�?

不少人把NIPS看成是机器学习方面最好的会议之一.
�q�个会议基本上控制在Michael

Jordan的徒子徒孙手�? 所以对Jordan�pȝ��人来�?
发NIPS�q�不是难�? 一些未必很

强的工作也能发上�? 但对�q�个圈子之外的�h来说,
惛_��一��实在很�? 因�ؓ留给"�?

�?的口子很��? 所以对Jordan�p�M��外的人来�?
发NIPS的难度比ICML更大. 换句话说,

ICML比较开�? ��圈子的影响不象NIPS那么�?
所以北��和�Ƨ洲人都�? 而NIPS则有

些�h(特别是一些欧�z��h, 包括一些大�?坚决不投�E?
�q�对会议本��n当然�q�不是好�?

但因为Jordan�p�d��强大, 所以它��g��也不太care.
最�q�IMLS(国际机器学习学会)攚w�?

理事,
有资格提名的人包括近三年在ICMLECMLCOLT发过文章的�h,
NIPS则被排除�?

外了. 无论如何, �q�是一个非常好的会.

ACL (1-): 计算语言�?自然语言处理斚w��最好的会议, ACL
(Association of

Computational Linguistics) ��d��, 每年开.

KR (1-): 知识表示和推理方面最好的会议之一,
实际上也是传�l�AI(卛_��于逻辑的AI)

最好的会议之一. KR Inc.��d��, 现在是偶数年开.

SIGIR (1-): 信息��索方面最好的会议, ACM��d��, 每年开. �q�个会现在小圈子气越�?

��重. 信息��索应该不��AI,
不过因�ؓ�q�里面用到机器学习越来越�? 最�q�几�q�甚�?有点机器学习应用会议的味道了, 所以把它也列进�?

SIGKDD (1-): 数据挖掘斚w��最好的会议, ACM��d��, 每年开. �q�个会议历史比较�?

毕竟,
与其他领域相�?数据挖掘�q�只是个��弟弟甚臛_��侄儿.
在几�q�前�q�很难把它列在tier-1里面, 一斚w��是名声远不及其他的top
conference响亮, 另一斚w��是相对容�?被录�?
但现在它被列在tier-1应该是毫无疑问的事情�?
�q�几�q�来KDD的质量都�?�? SIGKDD�?000�q�来full paper的录取率都在10%-12%之间�Q�远�q�低于IJCAI和ICML.

�l�常听�h��_��KDD要比IJICAI和ICML都要困难。IJICAI�?��，而KDD�?0��c��没有扎实系�l?

的工作，很难不留下漏�z�。有不少IJICAI的常客也每年都投KDD�Q�可隑־�几个能经�怸��?

UAI (1-): 名字�?人工��中的不确定�?,
涉及表示推理学习�{�很多方�? AUAI

(Association of UAI) ��d��, 每年开

草儿 2006-12-28 23:05 发表评论

草儿 — Wed, 27 Dec 2006 14:47:00 GMT
从最早用文�g�pȝ��存储数据��v�Q�数据库的发展已�l�有50多年了，光��l�历�?0世纪60�q�代的层�ơ数据库(IBM的IMS)和网状数据库(GE�?IDS)的�ƈ存，70~80�q�代关系数据库的异军�H��v�Q?0�q�代对象技术的影响。如今，关系数据库依然处于主��地位。关�p�L��术之后，在新形势下，数据库应该如何发�?又有哪些重要的趋势呢?
　　作�ؓ成熟的��品，关系数据库已�l�走�q�了几十�q�的历史�Q�而今�q�各��L��数据库厂商大动干戈、紧锣密鼓地�{�备各自��C�品发布，为��^淡的数据库市场掀起了��C��轮热潮�?甲骨文刚刚推��Z��其Oracle 10g的第二版�?IBM代号为Viper(毒蛇)的新一代DB2数据库��品将于今�q?月䆾推出��试版本;微��Y公司的SQL Server 2005已经在测试中�Q�今�q�底卛_��面世;Sybase也将于下个月推出新版本的数据库��品Sybase ASE 15。各数据库厂商集中火力瞄准的数据库市场竞争焦�Ҏ��什�?��C��代数据库有哪些新的技术趋�?
　　对主��企业数据库厂商包括甲骨文、IBM、微软、Sybase的采访表明，对XML的支持、网格技术、整合数据仓库和BI应用以及自我��理已成��Z��一代数据库在功能上角逐的焦点�?/p>
　　��势之一�Q�对XML的支�?/strong>
　　“如果谁能控制、支持和存储所有类型的数据�Q�那么这��L��厂商也就有能力扩展自己其他��品和服务的市场空间。因此整合XML、对象数据、多媒体数据�Q�将所有数据类型放在一个��^��C��是传统的关�p�L��据库发展的一大趋�ѝ��”这也是数据库厂商大动干戈的主要原因�?/p>
　　传统关系数据库中�Q�管理的是结构化数据�Q�数据是以行和列的二�l�表形式�q�行存储�Q��ƈ通过标准的SQL查询语言�q�行查询。而随着Web时代的到来，�?Web大背景下“泛数据”管理成��Z�h们关注的重点。所谓泛数据��是指包含了文档、电子邮件等各种�c�d��的数据，�q�些数据通常都不是以行和列的格式存在的，不像关系数据那样是严格的�l�构化数据，因此对这�c�L��据的存储��理以及快速高效的查询是对传统关系型数据库的挑战�?/p>
　　目前XML标准日益成熟�Q��ƈ很快成�ؓ各种复杂的异构数据交换的核心技术和未来数据定义的标准格式，例如�Q�微软将在下一代Office软�g中采�?XML数据格式。因此，��Native(原生)XML格式的数据存储在关系数据库中�q�支持对XMLQuery查询�Q�正是这些新推出的数据库产品的亮点之一�?/p>
　　甲骨文公司大中华区销售顾问部高��ȝ��李颖聪表�C�，甲骨文在几年前就已经看到了这个趋势，�q�提供了�W�一轮的XML支持。早期是通过一个工��P��实现不同应用之间的沟通。例如在Oracle 8i产品中，甲骨文就已经推出了XDK(XML开发工�?�Q�通过XDK开发应用把XML数据存储到关�p�L��据库�?在Oracle 9i产品中，则已�l�能够在数据库中定义XML数据�c�d��Q�通过SQL生成XML数据和对其进行查�?而在Oracle 10g中，则已�l�提供了对XML Query语言(XQuery)的支持，而且在Oracle 10g中，XML数据是作��Z��个独立的方式存储在XMLDB数据库中�Q�提供的是Native XML的支持�?/p>
　　而对��于2006�q�推出的下一个版本的IBM DB2来说�Q�集成结构化和非�l�构化数据�ƈ支持SQL及Xquery查询也将是其最大的卖点�Q�IBM公司信息��理部门�ȝ��理珍��特·帕尔�?Janet Perna)认�ؓ�Q�关�p�L��据库寚w��l�构化数据的支持不亚于从层次数据库到关系数据库的革命性�{变。“XML在信息管理领域无处不在，不管是管理结构化或非�l�构化信息，或者用于信息传输，或者是集成信息的映��标准。它现在是不可或�~�的。�?/p>
　　微��Y中国数据库��品经理表�C�，��于今年下半�q�发布的Microsoft SQL Server 2005��满��_��户希望把大量XML数据攑օ�数据库中的需求，�q�提供Native(原生)XML和XQuery的支持。“微软是XQuery标准的制定者之一�Q�在SQL Server 2005中微软加入了很多核心技术，实现了快速查询，而且使得性能得到优化。�?/p>
　　Sybase(中国)公司高��产品市场专员韩谊则指出，Sybase是较早在数据库中支持XML的厂商之一。目前Sybase ASE可以��XML文档存储在text或Image列中�Q�可以将XML映射到新的或已有的关�p�表中，可以从关�p�L��询中创徏XML格式的结果集。未�?Sybase除了不断��d��对XML新技术、新标准的支持，�q�要��d��更多函数�Q�增强对Web Service支持�Q��用户更方便的使用XML�?/p>
　　InterSystems中国技术�ȝ��余衡也表�C�，InterSystems公司的后关系型数据库Caché已经完全支持XML了，而且�q�种支持来自�?Caché独特的数据存储方式，使得XML的数据可以完��地保存在Caché数据库中�Q�不论存取还是查询分析都非常��单。关�p�L��据库保存数据是采用二�l�表的方式，而Caché的存储方式是采用了多�l�数�l�的存储方式�Q�从而很�Ҏ��地实��C��l�构化数据的存取。同时在�q�个多维数据存储之上�Q�Caché同时实现了对象的讉K��方式和SQL的访问方式�?/p>
　　Burton 集团的高�U�分析师Peter O'Kelly 则指出，如果用户的关�p�L��据库支持原生XML数据�Q�那么就可以享受到XML数据格式带来的很多安全特性。例如，可以在整个文档中插入电子�{�֐��Q�也可以��采购订单直接存储，无须�q�行��M��的�{换，�q�些�Ҏ��都可以��保文档不会被篡攏V��但记者在对国内一些中��企业用��L��采访中，很多客户都表�C�Z��对XML查询的需求还不是很迫切。贝塔斯曼文化实业有限公司IT�ȝ��江玮、佐丹奴 /Giordano集团CIO侯��T、永恩集团CIO赉|��雨都表示�Q�目前对XML支持的需求还不是很迫切。但他们表示�Q�对XML数据库是否真正能够达到的目标或对企业业务的帮助还不是非常了解�Q�需要��l�了解相��x��术和知识以及发展情况。针�Ҏ��Q�甲骨文公司中国区销售顾问部高��l�理裴雪松表�C�，当CIO��x��信息整合�Ӟ��XML��是必备的工��P��事实上，目前国内很多银行、电信等客户在进行应用整合时已经��XML作�ؓ其标准�?/p>
　　��势之二�Q�网格支�?/strong>
　　“网格就是下一代Internet”，�q�句话强调了�|�格可能�Ҏ��来社会的巨大影响。在历史上，数据库系�l�曾�l�接受了Internet带来的挑战。毫无疑问，现在数据库系�l�也��应对网格带来的挑战。甲骨文公司Oracle 10g�|�格数据库��品的推出�Q�则��网格技术的应用领域扩展��C��业计��。但针对数据库对�|�格技术的支持�Q�目前一些厂商还持有不同的观点，例如微��Y�?InterSystems��指出，�|�格�q��惟一的答案�?/p>
　　“网��D��将是数据库技术发展的大趋势之一�Q�数据库不仅仅是存储数据�Q�而是要实现对信息整个生命周期的管理。而甲骨文提出的网格数据库则是��其落到实处。”据悉，自Oracle 10g��d��发布后，很多被资源、管理困扰的客户都对甲骨文的�|�格技术非常感兴趣�Q�而且已经在很多领域得到应用。李颖聪同时表示�Q�在甲骨文刚刚发布的 Oracle 10g Release 2中又�q�一步改良了许多�|�格�q�算的功能，提升了性能、应用度以及��化管理功能。该�Ҏ��可让客户��多台标准服务器�pȝ��整合成一套可扩充的容错运��^台。同�Ӟ��新版数据库可让客��h��Ҏ��在网格环境中分��n储存资源�Q��ƈ且大�q�提升数据安全性。李颖聪表示�Q�甲骨文在未来的产品中将会��l�关注网格技术�?Sybase公司则表�C�，��管�|�格技术要成�ؓ商业应用的主��，�q�需要几�q�时间在应用和��品上�q�一步完善，但Sybase非常��x��q�种技术，已经作了一些技术探索和储备�Q��ƈ希望能在不远的将来推出成熟的产品�?/p>
　　而微软则表示�Q�目前微软还没有考虑到对�|�格技术的支持。他认�ؓ�Q�网格是一�U�扩展技术，扩展有两�U�方式：向上扩展(Scale up )和向外扩�?Scale out)�Q�向上扩展是增加CPU的个数和内存�{�资源满��用��L��需求，而向外扩展就是多节点�q�行技术，或者说是网格的技术。微软的一��调查显�C�：目前99%的客户需求是�?6颗CPU以下�Q�而目前，微��Y的SQL Server 2005最多可以支�?4颗CPU�Q�因此微软认为，通过向上扩展完全能够满��客户的需求，而没有必要采用向外扩展技术�?/p>
　　另外�Q�微软认为，�|�格应用在技术上�q�需解决一些问题。例如，�|�格中对资源的共享是通过�׃�n��盘实现�?Share Disk)�Q��ƈ通过锁控制器(Lock manager)实现多个节点对资源的争夺�Q�管理节点对资源的访问，当节点增多，会带来性能的下降�?/p>
　　InterSystems中国技术�ȝ��余衡也表�C�，�|�格计算在科学计��领域非常受�Ƣ迎�Q�例如对于处理电�׃��品中帧的应用�E�序�Q�或者处理复杂静态数据的数据仓库、处理复杂�ƈ需要长旉��q�行的查询，�|�格计算也许是合适的。但�|�格计算不是�l�对的答案，对于大范围的事务处理�c�d��的应用程序，�q�行高速数据库更新操作与计��，�|�格计算可能��׃��适合了。在商业领域或者非�U�学斚w��的应用中�Q�把��d��分解成逻辑或者功能组件比分解成过�E�更有意义�?/p>
　　李颖聪介�l�，Tom�|�站的用��L��理系�l�已�l�采用了Oracle 10g的网格技术，在�ƈ发处理能力的加强、自动扩展以及降低��Y件成本方面都起到了很好的作用。在采访中，很多用户也表�C�对�|�格技术在数据库中的应用非常关注，但正如永恩集团CIO赉|��雨所�a��Q�对采用普通结点组成的�pȝ��的性能是否真正可以辑ֈ�期望�q�有很多考虑。而佐丹奴集团CIO侯��T则表�C�，作�ؓ一个规模不��很大的企业�Q�一��C��台服务器已经可以满��现时及未来几�q�企业发展的需要了�Q�目前�ƈ没有��x��|�格技术�?strong>��势之三�Q�整合数据仓�?BI
　　数据库应用的成熟�Q��得企业数据库里承载的数据��来��多。但数据的增多，随之而来的问题就是如何从��量的数据中抽取出具有决�{�意义的信息(有用的数�?�Q�更好地服务于企业当前的业务�Q�这��需要商业智能。“从用户�Ҏ��据管理需求的角度看，可以划分两大�c�：一是对传统的、日常的事务处理�Q�也��x��们经常提的联��Z��务处�?OLTP)应用;二是联机分析处理(OLAP)与辅助决�{�，既商业智�?BI)。数据库不仅支持OLTP�Q�还应该��Z��务决�{�、分析提供支持。�?目前�Q�主��的数据库厂商都已经把支持OLAP、商业智能做为关�p�L��据库发展的另一大趋�ѝ�?/p>
　　商业��是指以帮助企业决�{��ؓ目的�Q�对数据�q�行攉��、存储、分析、访问等处理的一大类技术及其应用，�׃��需要对大量的数据进行快速地查询和分析，传统的关�p�d��数据库不能很好地满��q�种要求。或者说传统上，数据库应用是��Z��OLTP(在线交易处理)模型的，而不能很好支持OLAP(在线分析处理)�Q�商业智能是以数据仓库�ؓ基础�Q�目前同时支持OLTP和OLAP�q�两�U�模式是关系数据库的着眼点所在�?/p>
　　例如�Q�IBM一直把商业��应用当作 DB2的一个重要发展方向，�q�将商业��功能构徏�?DB2引擎中，例如DB2本��n内置了数据库、在�U�分析的处理(OLAP)、各�U�分析等功能�Q�去�q�发布的DB2 8.3版本中又�q�一步加��Z��分析功能�Q��ؓ商业��应用�q�行了性能优化。目前可以通过两种方式�?DB2 �q�行联机分析处理(OLAP)�Q�首先DB2 提供了用�?CUBE �?ROLLUP(用于研究数据库中信息的流行的 OLAP 操作)的内�|�函数。其�ơ，IBM �?Hyperion 合作创徏�?DB2 OLAP Server�Q�DB2 OLAPServer 构徏在DB2 UDB 之上�Q�同时提供了多维数据存储和关�p�L��据存储。IBM �q�与各类数据分析软�g供应商合作，�q�些供应商��他们的工兯��使用 DB2 数据库�?/p>
　　微��Y也指出，微��Y�?997�q�开始在数据库��品中增加了BI功能�Q�在SQL Server 2005中，微��Y��提供统一数据模型�Q�同时支持OLTP和OLAP两个模型�Q��ƈ通过XML/A接口�Q�实现对数据库和数据仓库的访问，把关�p�L��据库和BI功能整合在一赗��?/p>
　　甲骨文公司商业智能和数据仓库副总裁Ray Roccaforte表示�Q�“几�q�前�Q�我们开始实施一��简化复杂商业智能环境的计划。�v初我们的重点是：让客户在实施商业��目时不必面对多�U�专门的数据挖掘、OLAP和统计数据库�Q�我们直接把�q�些功能合�ƈ到Oracle数据库中。现在这�U�做法已�l�扩展到商业��软�g工具上了�Q�我们把所有必需的��Y件工��L��合到单一产品中，以此满��客户的商业智能需求。�?据悉�Q�新版本的甲骨文商业��(Oracle Business Intelligence)工具目前正处于开发测试阶�D�，包括了Oracle Discoverer、Oracle Spreadsheet Add-In、Oracle Warehouse Builder、Oracle BI Beans�{�。通过Oracle Discoverer可在单一报告环境中存取关�p�L��?即SQL)和联机分析处�?OLAP)数据�Q�从而完成一般需要两�U��Y件工��h��能完成的��d��?/p>
　　Sybase在即��发布的数据库ASE15版本中也��强化对OLAP分析表现功能的支持，�q�样对中��企业客��h��_��通过数据库就可以实现BI斚w��的应�?当然对一些大型用��P��Sybase也提供了专业的数据仓库和商业��应用解决�Ҏ��?/p>
　　��势之四�Q�管理自动化
　　企业�U�数据库产品目前已经�q�入同质化竞争时代，在功能、性能、可靠性等斚w��差别已经不是很大。但是随着商业环境竞争日益加剧�Q�目前企业面临着另外的挑战，卛_��何以最低的成本同时又高质量地管理其IT架构。这也就带来了两斚w��的挑战：一斚w��pȝ��功能日益强大而复杂，另一斚w��Q�对�q�些�pȝ��理和维护的成本��来��昂��c��正是意识到�q�些需求，自我��理功能包括能自动地�Ҏ��据库自��n�q�行监控、调整和修复�{�已成�ؓ数据库追求的目标�?“我们正看到��来��多的基于成本和可管理性的竞争�Q�因为市场正在寻扑ֺ�用更��单，拥有成本更低的数据库 �?Gartner研究集团一位追�t�数据库软�g市场多年的分析员�q�样表示�?/p>
　　Oracle的可��理性战略侧重在两个斚w��Q�首先是使Oracle产品的每一部分(包括数据�?��可能地�q�行自我��理�Q�以实现最��的人力��理;�W�二是��整个数据库中心的��理更便捗��高效，例如Oracle企业��理器就提供了一套解��x��案，用于��理和监视基于Oracle�p�d��技术的应用�E�序和系�l��?/p>
　　IBM已在其DB2数据库的应用中集成了自我��理功能�Q�它可以让一个数据库自行发现问题�q��新设�|�。“IBM DB2是一个SMART的数据库�Q�即自我��理及资源调度的��数据库系�l�。DB2由数据库�pȝ��自己�q�行错误分析、可能的解决�Ҏ��及自我修复的功能�Q�提供部分核心配�|�参数进行自动配�|�，而不需数据库管理员�q�行指定和修攏V��”Janet Perna表示�Q�在IBM的新版本数据库Viper中，��会有更多自��d��能，如自我管理和自我修复功能�?/p>
　　Sybase也表�C�，Sybase数据库一向以低成本而得到用户青睐，低成本主要体现在两个斚w��Q�一是购买成本，二是�l�护成本�Q�Sybase数据库的设计理念��是让用��h��Ҏ��上手、容易��用。而在卛_��推出的新版本中，�q�一步强化了易管理性，如图形化的操作界面、增加操作向��g��及自动执行功能，使数据库��理人员不必要做很多重复性的工作�?/p>
　　微��Y也强调，易于��理、易于��用是SQL Server的设计理��c��在SQL Server2005中微软新的管理工具套件、自我调节能力和功能强大的编�E�模型将允许数据库管理员针对数据库的日常�q��{加以灉|��掌控。针对SQL事�g探查器及其它工具的改�q�还可帮助数据库��理员将服务器调节至最��x��能状态。这些改�q�特性将允许数据库管理员从数据库日常�q��{工作中解脱出来，�q��中精力从事数据库体系�l�构设计�{�更具�h值的��d��?/p>

草儿 2006-12-27 22:47 发表评论

草儿 — Wed, 27 Dec 2006 12:06:00 GMT
Web 上有��量的数据信息，怎样对这些数据进行复杂的应用成了��C��数据库技术的研究热点。数据挖掘就是从大量的数据中发现隐含的规律性的内容�Q�解��x��据的应用质量问题。充分利用有用的数据�Q�废弃虚伪无用的数据�Q�是数据挖掘技术的最重要的应用。相对于Web的数据而言�Q�传�l�的数据库中的数据结构性很强，卛_��中的数据为完全结构化的数据，而Web上的数据最大特点就是半�l�构化。所谓半�l�构化是相对于完全结构化的传�l�数据库的数据而言。显�Ӟ��面向Web的数据挖掘比面向单个数据仓库的数据挖掘要复杂得多�?
　　1.异构数据库环�?/strong>
　　从数据库研究的角度出发，Web�|�站上的信息也可以看作一个数据库�Q�一个更大、更复杂的数据库。Web上的每一个站点就是一个数据源�Q�每个数据源都是异构的，因而每一站点之间的信息和�l�织都不一��P��q�就构成了一个巨大的异构数据库环境。如果想要利用这些数据进行数据挖掘，首先�Q�必��要研究站点之间异构数据的集成问题，只有��这些站点的数据都集成�v来，提供�l�用户一个统一的视图，才有可能从巨大的数据资源中获取所需的东�ѝ��其�ơ，�q�要解决Web上的数据查询问题�Q�因为如果所需的数据不能很有效地得刎ͼ�对这些数据进行分析、集成、处理就无从谈�v�?/p>
　　2.半结构化的数据结�?/strong>
　　Web 上的数据与传�l�的数据库中的数据不同，传统的数据库都有一定的数据模型�Q�可以根据模型来具体描述特定的数据。而Web上的数据非常复杂�Q�没有特定的模型描述�Q�每一站点的数据都各自独立设计�Q��ƈ且数据本�w�具有自�q�性和动态可变性。因而，Web上的数据��h��一定的�l�构性，但因自述层次的存在，从而是一�U�非完全�l�构化的数据�Q�这也被�U�C��为半�l�构化数据。半�l�构化是Web上数据的最大特炏V�?/p>
　　3.解决半结构化的数据源问题
　　Web 数据挖掘技术首要解军_��l�构化数据源模型和半�l�构化数据模型的查询与集成问题。解决Web上的异构数据的集成与查询问题�Q�就必须要有一个模型来清晰地描�q?Web上的数据。针对Web上的数据半结构化的特点，��L��一个半�l�构化的数据模型是解决问题的关键所在。除了要定义一个半�l�构化数据模型外�Q�还需要一�U�半�l�构化模型抽取技术，卌��动地从现有数据中抽取半结构化模型的技术。面向Web的数据挖掘必��M��半结构化模型和半�l�构化数据模型抽取技术�ؓ前提�?/p>
XML与Web数据挖掘技�?/font>
　　以XML 为基��的新一代WWW环境是直接面对Web数据的，不仅可以很好地兼容原有的Web应用�Q�而且可以更好地实现Web中的信息�׃�n与交换。XML可看作一�U�半�l�构化的数据模型�Q�可以很�Ҏ��地将XML的文档描�q�C��关系数据库中的属性一对应��h��Q�实施精��地查询与模型抽取�?/font>

　　1.XML的��生与发展

　　XML (eXtensibleMarkupLanguage)是由万维�|�协�?W3C)设计�Q�特别�ؓWeb应用服务的SGML (StandardGeneralMarkupLanguage)的一个重要分支。�ȝ��来说�Q�XML是一�U�中介标�C��a�(Meta- markupLanguage)�Q�可提供描述�l�构化资料的格式�Q�详�l�来��_��XML是一�U�类��g��HTML�Q�被设计用来描述数据的语�a�。XML提供了一�U�独立的�q�行�E�序的方法来�׃�n数据�Q�它是用来自动描�q�C��息的一�U�新的标准语�a��Q�它能��计算机通信把Internet的功能由信息传递扩大到人类其他多种多样的活动中厅R��XML��p��q�规则组成，�q�些规则可用于创建标记语�a��Q��ƈ能用一�U�被�U�C��分析�E�序的简明程序处理所有新创徏的标记语�a��Q�正如HTML为第一个计��机用户阅读Internet文档提供一�U�显�C�方式一��P��XML也创��Z��一�U��Q何�h都能��d��和写入的世界语。XML解决了HTML不能解决的两个Web问题�Q�即Internet发展速度快而接入速度慢的问题�Q�以及可利用的信息多�Q�但难以扑ֈ�自己需要的那部分信息的问题。XML能增加结构和语义信息�Q�可使计��机和服务器��x��处理多种形式的信息。因此，�q�用XML的扩展功能不仅能从Web服务器下载大量的信息�Q�还能大大减��网�l�业务量�?/font>

　　XML 中的标志(TAG)是没有预先定义的�Q��用者必��要自定义需要的标志�Q�XML是能够进行自解释(SelfDescribing)的语�a�。XML使用DTD (DocumentTypeDefinition文档�c�d��定义)来显�C��些数据，XSL(eXtensibleStyleSheetLanguage)是一�U�来描述�q�些文档如何昄��的机�Ӟ��它是XML的样式表描述语言。XSL的历史比HTML用的CSS(层叠式样式表 CascadingStyleSheets)�q�要悠久�Q�XSL包括两部分：一个用来�{换XML文档的方�?一个用来格式化XML文档的方法。XLL (eXtensibleLinkLanguage)是XML�q�接语言�Q�它提供XML中的�q�接�Q�与HTML中的�c�M��Q�但功能更强大。��用XLL�Q�可以多方向�q�接�Q�且�q�接可以存在于对象层�U�，而不仅仅是页面层�U�。由于XML能够标记更多的信息，所以它��p��使用户很��L��地找��C��们需要的信息。利用XML�Q�Web 设计人员不仅能创建文字和囑�Ş�Q�而且�q�能构徏文档�c�d��定义的多层次、相互依存的�pȝ��、数据树、元数据、超链接�l�构和样式表�?/font>

　　2.XML的主要特�?/font>

　　正是XML的特点决定了其卓��的性能表现。XML作�ؓ一�U�标记语�a��Q�有许多特点�Q?/font>

　　(1)��单。XML�l�过�_�ֿ�设计�Q�整个规范简单明了，它由若干规则�l�成�Q�这些规则可用于创徏标记语言�Q��ƈ能用一�U�常常称作分析程序的��明程序处理所有新创徏的标记语�a�。XML能创��Z��U��Q何�h都能��d��和写入的世界语，�q�种创徏世界语的功能叫做�l�一性功能。如XML创徏的标记��L��成对出现�Q�以及依靠称作统一代码的新的编码标准�?/font>

　　(2)开放。XML是SGML在市��Z��有许多成熟的软�g可用来帮助编写、管理等,开攑ּ�标准XML的基��是经�q�验证的标准技术，�q��对网�l�做最佛_��。众多业界顶��公司，与W3C的工作群�l��ƈ肩合作，协助��保交互作业性，支持各式�pȝ��和浏览器上的开发�h员、作者和使用者，以及改进XML标准。XML解释器可以��用编�E�的�Ҏ��来蝲入一个XML的文档，当这个文档被载入以后,用户��可以通过XML文�g对象模型来获取和操纵整个文档的信息，加快了网�l�运行速度�?/font>

　　(3)高效且可扩充。支持复用文档片断，使用者可以发明和使用自己的标�{�，也可与他人共享，可�g伸性大�Q�在XML中，可以定义无限量的一�l�标注。XML提供了一个标�C�结构化资料的架构。一个XML�l��g可以宣告与其相关的资料�ؓ零售仗��营业税、书名、数量或其它��M��数据元素。随着世界范围内的许多机构逐渐采用 XML标准�Q�将会有更多的相兛_��能出玎ͼ�一旦锁定资料，便可以��用�Q何方式透过�늼��U�传递，�q�在��览器中呈现�Q�或者�{交到其他应用�E�序做进一步的处理�?XML提供了一个独立的�q�用�E�序的方法来�׃�n数据�Q��用DTD�Q�不同的�l�中的�h��p��够��用共同的DTD来交换数据。你的应用程序可以��用这个标准的DTD 来验证你接受到的数据是否有效�Q�你也可以��用一个DTD来验证你自己的数据�?/font>

　　(4)国际化。标准国际化�Q�且支持世界上大多数文字。这源于依靠它的�l�一代码的新的编码标准，�q�种�~�码标准支持世界上所有以主要语言�~�写的�؜合文本。在HTML 中，��大多数字处理而言�Q�一个文档一般是用一�U�特�D�语�a�写成的，不管是英语，�q�是日语或阿拉伯语，如果用户的��Y件不能阅�ȝ��D�语�a�的字�W�，那么他就不能使用该文档。但是能阅读XML语言的��Y件就能顺利处理这些不同语�a�字符的�Q意组合。因此，XML不仅能在不同的计��机�pȝ��之间交换信息�Q�而且能跨国界和超��不同文化疆界交换信息�?/font>
3.XML在Web数据挖掘中的应用
　　XML 已经成�ؓ正式的规范，开发�h员能够用XML的格式标记和交换数据。XML在三层架构上为数据处理提供了很好的方法。��用可升��的三层模型，XML可以从存在的数据中��生出来，使用XML�l�构化的数据可以从商业规范和表现形式中分��d��来。数据的集成、发送、处理和昄��是下面过�E�中的每一个步�?

　　促进XML应用的是那些用标准的HTML无法完成的Web应用。这些应用从大的斚w��讲可以被分成以下四类�Q�需要Web客户端在两个或更多异质数据库之间�q�行通信的应�?试图��大部分处理负蝲从Web服务器�{到Web客户端的应用;需要Web客户端将同样的数据以不同的浏览�Ş式提供给不同的用��L��应用;需要智能Web代理�Ҏ��个�h用户的需要裁减信息内容的应用。显而易见，�q�些应用和Web的数据挖掘技术有着重要的联�p�，��Z��Web的数据挖掘必��M��靠它们来实现�?/font>

　　XML �l�基于Web的应用��Y件赋予了强大的功能和灉|��性，因此它给开发者和用户带来了许多好处。比如进行更有意义的搜烦�Q��ƈ且Web数据可被XML唯一地标识。没有XML�Q�搜索��Y件必��M��解每个数据库是如何构建的�Q�但�q�实际上是不可能的，因�ؓ每个数据库描�q�数据的格式几乎都是不同的。由于不同来源数据的集成问题的存在，现在搜烦多样的不兼容的数据库实际上是不可能的。XML能够使不同来源的�l�构化的数据很容易地�l�合在一赗��Y件代理商可以在中间层的服务器上对从后端数据库和其它应用处来的数据�q�行集成。然后，数据��p��被发送到客户或其他服务器做进一步的集合、处理和分发。XML的扩展性和灉|��性允许它描述不同�U�类应用软�g中的数据�Q�从描述搜集的Web��到数据记录�Q�从而通过多种应用得到数据。同�Ӟ��׃��Z��XML的数据是自我描述的，数据不需要有内部描述��p��被交换和处理。利用XML�Q�用户可以方便地�q�行本地计算和处理，XML格式的数据发送给客户后，客户可以用应用��Y件解析数据�ƈ�Ҏ��据进行编辑和处理。��用者可以用不同的方法处理数据，而不仅仅是显�C�它。XML文档对象模式(DOM)允许用脚本或其他�~�程语言处理数据�Q�数据计��不需要回到服务器��p��q�行�?XML可以被利用来分离使用者观看数据的界面�Q��用简单灵�z�d��攄��格式�Q�可以给Web创徏功能强大的应用��Y�Ӟ��而原来这些��Y件只能徏立在高端数据库上。另外，数据发到桌面后，能够用多�U�方式显�C��?/font>

　　XML �q�可以通过以简单开放扩展的方式描述�l�构化的数据�Q�XML补充了HTML�Q�被�q�泛地用来描�q�C��用者界面。HTML描述数据的外观，而XML描述数据本��n。由于数据显�C�Z��内容分开�Q�XML定义的数据允许指定不同的昄��方式�Q��数据更合理地表现出来。本地的数据能够以客户配�|�、��用者选择或其他标准决定的方式动态地表现出来。CSS和XSL为数据的昄��提供了公布的机制。通过XML�Q�数据可以粒状地更新。每当一部分数据变化后，不需要重发整个结构化的数据。变化的元素必须从服务器发送给客户�Q�变化的数据不需要刷新整个��用者的界面��p��够显�C�出来。但在目前，只要一条数据变化了�Q�整一��都必须重徏。这严重限制了服务器的升�U�性能。XML也允许加�q�其他数据，比如预测的温度。加入的信息能够�q�入存在的页面，不需要浏览器重新发一个新的页面。XML应用于客户需要与不同的数据源�q�行交互�Ӟ��数据可能来自不同的数据库�Q�它们都有各自不同的复杂格式。但客户与这些数据库间只通过一�U�标准语�a��q�行交互�Q�那��是XML。由�?XML的自定义性及可扩展性，它��以表辑֐��U�类型的数据。客��h��到数据后可以�q�行处理�Q�也可以在不同数据库间进行传递。��M��Q�在�q�类应用中，XML解决了数据的�l�一接口问题。但是，与其他的数据传递标准不同的是，XML�q�没有定义数据文件中数据出现的具体规范，而是在数据中附加TAG来表达数据的逻辑�l�构和含义。这使XML成�ؓ一�U�程序能自动理解的规范�?/font>

　　XML 应用于将大量�q�算负荷分布在客��L��Q�即客户可根据自��q��需求选择和制作不同的应用�E�序以处理数据，而服务器只须发出同一个XML文�g。如按传�l�的 “Client/Server”工作方式，客户向服务器发出不同的请求，服务器分别予以响应，�q�不仅加重服务器本��n的负��P��而且�|�络��理者还��M��先调查各�U�不同的用户需求以做出相应不同的程序，但假如用��L��需求繁杂而多变，则仍然将所有业务逻辑集中在服务器端是不合适的�Q�因为服务器端的�~�程人员可能来不及满��众多的应用需求，也来不及跟上需求的变化�Q�双斚w��很被动。应用XML则将处理数据的主动权交给了客��P��服务器所作的只是��可能完善、准��地��数据封装进XML文�g中，正是各取所需、各司其职。XML的自解释性��客户端在收到数据的同时也理解数据的逻辑�l�构与含义，从而��q�泛、通用的分布式计算成�ؓ可能�?/font>

　　XML �q�被应用于网�l�代理，以便�Ҏ��取得的信息进行编辑、增减以适应个�h用户的需要。有些客户取得数据�ƈ不是��Z��直接使用而是��Z��Ҏ��需要组�l�自��q��数据库。比方说�Q�教育部门要建立一个庞大的题库�Q�考试时将题库中的题目取出若干�l�成试卷�Q�再��试卷封装进XML文�g�Q�接下来在各个学校让光��过一个过滤器�Q��o掉所有的�{�案�Q�再发送到各个考生面前�Q�未�l�过滤的内容则可直接送到老师手中�Q�当然考试�q�后�q�可以再传送一份答案汇�~�。此外，XML文�g中还可以包含�q�诸如难度系数、往�q�错误率�{�其他相关信息，�q�样只需几个��程序，同一个XML文�g便可变成多个文�g传送到不同的用��h��中�?/font>

　　�l�束�?:

　　面向Web的数据挖掘是一��复杂的技术，�׃��Web数据挖掘比单个数据仓库的挖掘要复杂的多，因而面向Web的数据挖掘成了一个难以解决的问题。而XML的出��Cؓ解决Web数据挖掘的难题带来了��Z��。由于XML能够使不同来源的�l�构化的数据很容易地�l�合在一��P��因而��搜烦多样的不兼容的数据库能够成�ؓ可能�Q�从而�ؓ解决Web数据挖掘��N��带来了希望。XML的扩展性和灉|��性允许XML描述不同�U�类应用软�g中的数据�Q�从而能描述搜集的Web��中的数据记录。同�Ӟ��׃��Z��XML的数据是自我描述的，数据不需要有内部描述��p��被交换和处理。作��C�结构化数据的一个工业标准，XML为组�l�、��Y件开发者、Web站点和终端��用者提供了许多有利条�g。相信在以后�Q�随着XML作�ؓ在Web上交换数据的一�U�标准方式的出现�Q�面向Web的数据挖掘将会变得非常轻松�?/font>

草儿 2006-12-27 20:06 发表评论


		Fuhwei Lwo 目前�?WebSphere Service Data Objects (SDO) 的团队负责�h。他主要的工作重�Ҏ��推动在面向服务的体系�l�构�Q�Service Oriented Architecture�Q�SOA�Q�中��?SDO 作�ؓ数据数据模型�~�程 API 成功采用�?/p>

日本高清久久一区二区三区,成人在线超碰,av一区在线

JAVA�l��g�q���o器Filter

一个Servlet生命周期�Q�Tomcat处理��h��中）

MySQL DB学习�W�记A

数据挖掘与统计学

SDO2.0�Q�创建和��d�� XML 文档

COGNOS业务�����产品

SPSS �l�计软�g的主菜单及子菜单

Web信息抽取技术纵览二

Web信息抽取技术纵览一

几个人工�����会议(转蝲)

JAVA�l��g�q��o器Filter

COGNOS业务��产品

几个人工��会议(转蝲)