一级片在线视频,自拍偷拍欧美视频,伊人久久大香线蕉综合网站

java sax 解析实例

��菜毛毛 — Wed, 11 May 2011 14:34:00 GMT

�?/strong>SAX解析XML实例

实例�Q�以下输�?/strong>中的所有属性和标签�?/strong>
package com.meixin.xml;

import java.io.File;
import java.util.HashMap;
import java.util.Vector;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

public class PraseXML extends DefaultHandler
{

  private Vector tagName;

  private Vector tagValue;

  private int step;

  // 开始解析XML文�g
  public void startDocument() throws SAXException
  {
    tagName = new Vector();
    tagValue = new Vector();
    step = 0;
  }

  // �l�束解析XML文�g
  public void endDocument() throws SAXException
  {
    for (int i = 0; i < tagName.size(); i++)
    {
      if (!tagName.get(i).equals("") || tagName.get(i) != null)
      {
        System.out.println("节点名称�Q? + tagName.get(i));
        System.out.println("节点��|��(x��)" + tagValue.get(i));
      }
    }
  }

  /**
    * 在解释到一个开始元素时�?x��)调用此��?gu��)��.但是当元素有重复时可以自己写��法来区�?
    * �q�些重复的元�?qName是什�? �q�样写就�?x��)抛出SAXException错误
    * 通常情况下qName�{�于localName
    */
  public void startElement(String uri, String localName, String qName,
      Attributes attributes) throws SAXException
  {
    // 节点名称
    tagName.add(qName);
    // 循环输出属�?
    for (int i = 0; i < attributes.getLength(); i++)
    {
      // 获取属性名�U?
      System.out.println("属性名�U�ͼ�(x��)" + attributes.getQName(i));
      // 获取属性�?
      System.out.println("属性��|��(x��)"
          + attributes.getValue(attributes.getQName(i)));
    }

  }

  /**
    * 在遇到结束标�{�时调用此方�?
    */
  public void endElement(String uri, String localName, String qName)
      throws SAXException
  {

    step = step + 1;
  }

  /**
    * ��d��标签里的�?ch用来存放某行的xml的字�W�数�?包括标签,初始大小�?048,
    * 每解释到新的字符�?x��)把它添加到char[]里�?nbsp;   * 注意,�q�个char字符�?x��)自��q��理存储的字符,
    * �q�不是每一行就�?x��)刷��C��ơchar,start,length是由xml的元素数据确定的,
    * 暂时找不到规�?以后看源代码.
    *
    * �q�里一个正标签�Q�反标签都会(x��)被执行一�ơcharacters�Q�所以在反标�{�时不用获得其中的�?
    */
  public void characters(char ch[], int start, int length)
      throws SAXException
  {
    // 只要当前的标�{��的长度一臻I��值就不赋�Q�则反标�{�不被计划在�?
    if (tagName.size() - 1 == tagValue.size())
    {
      tagValue.add(new String(ch, start, length));
    }
  }

  public static void main(String[] args)
  {
    String filename = "MyXml.xml";
    SAXParserFactory spf = SAXParserFactory.newInstance();
    try
    {
      SAXParser saxParser = spf.newSAXParser();
      saxParser.parse(new File(filename), new PraseXML());
    }
    catch (Exception e)
    {
      e.printStackTrace();
    }
  }

  public Vector getTagName()
  {
    return tagName;
  }

  public void setTagName(Vector tagName)
  {
    this.tagName = tagName;
  }

  public Vector getTagValue()
  {
    return tagValue;
  }

  public void setTagValue(Vector tagValue)
  {
    this.tagValue = tagValue;
  }

}

输出�l�果�Q?/span>

属性名�U�ͼ�(x��)personid
属性��|��(x��)e01
属性名�U�ͼ�(x��)enable
属性��|��(x��)true
属性名�U�ͼ�(x��)personid
属性��|��(x��)e02
属性名�U�ͼ�(x��)enable
属性��|��(x��)false
属性名�U�ͼ�(x��)personid
属性��|��(x��)e03
属性名�U�ͼ�(x��)enable
属性��|��(x��)true
节点名称�Q�people
节点��|��(x��)


节点名称�Q�person
节点��|��(x��)

节点名称�Q�name
节点��|��(x��)张三
节点名称�Q�tel
节点��|��(x��)5128
节点名称�Q�email
节点��|��(x��)txq512@sina.com
节点名称�Q�person
节点��|��(x��)

节点名称�Q�name
节点��|��(x��)meixin
节点名称�Q�tel
节点��|��(x��)5252525
节点名称�Q�email
节点��|��(x��)wnight88@sina.com
节点名称�Q�person
节点��|��(x��)

节点名称�Q�name
节点��|��(x��)yu
节点名称�Q�tel
节点��|��(x��)5389654
节点名称�Q�email
节点��|��(x��)yu@188.net

文�g内容

xml version="1.0" encoding="UTF-8"?>
<people>

  <person personid="e01" enable="true">
    <name>张三name>
    <tel>5128tel>
    <email>txq512@sina.comemail>
  person>

  <person personid="e02" enable="false">
    <name>meixinname>
    <tel>5252525tel>
    <email>wnight88@sina.comemail>
  person>

  <person personid="e03" enable="true">
    <name>yuname>
    <tel>5389654tel>
    <email>yu@188.netemail>
  person>

people>

http://wnight88.blog.51cto.com/512204/163197/

��菜毛毛 2011-05-11 22:34 发表评论

java反射详解

��菜毛毛 — Thu, 13 Jan 2011 09:09:00 GMT
摘要: Java的反��机制是Java�Ҏ(gu��)��之一�Q�反��机制是构徏框架技术的基础所在。灵�z�L��握Java反射机制�Q�对大家以后学习(f��n)框架技术有很大的帮助�? 那么什么是Java的反��呢�Q? 大家都知道，要让Java�E�序能够�q�行�Q�那么就得让Java�c�要被Java虚拟机加载。Java�c�d��果不被Java虚拟机加载，是不... 阅读全文

��菜毛毛 2011-01-13 17:09 发表评论

java中文汉字排序

��菜毛毛 — Fri, 17 Dec 2010 05:22:00 GMT

// Collator �c�L��用来执行区分语言环境�?String 比较的，�q�里选择使用CHINA

Comparator cmp = Collator.getInstance(java.util.Locale.CHINA);

TreeMap tree=new TreeMap(cmp);

String[] arr = {"张三", "李四", "王五"};

// 使根据指定比较器产生的顺序对指定对象数组�q�行排序�?nbsp;

   Arrays.sort(arr, cmp);

for (int i = 0; i < arr.length; i++)

    System.out.println(arr[i]);

�?

�C�Z��文本�Q?/h4>

String [] test = new String[] {
                "作业",
                "��试",
                "test",
                "我们",
                "。空",
                "镂空",
                "[",
                "��?,
                "�?
        };

jdk 版本�Q?/h4>
1.5.6

开发��^収ͼ�(x��)

Eclipse 3.1

关键字：(x��) 中文排序

概述

我们在应用程序中可能�?x��)经帔R��到对中文排序的问题，例如姓名列表�Q�词汇表�{�等。对中文排序�Q�我们��用比较多的是�Ҏ(gu��)��汉语拼音发音来确定顺序�?br />
我们可能�?x��)经�怋��?nbsp;

java.util.Set

接口�Q?

java.util.Arrays .sort((T[] a, Comparator super T> c))

�{�类或方法对含有中文字符的对象进行排序，但是�q�些在默认情况下都是调用

String .CompareTo(String )

�Ҏ(gu��)��Q�这个方法是比较2个字�W�的 codepoint value�Q�如果第一个字�W�的值小于第二个�Q�则在排序结果中�W�一个会(x��)在前面，反之亦然�?/p>

java.text.Collator

接口�?qi��ng)其实现�c?/h3>

其实 java 中提供了(ji��n)和语�a�相关的类�Q�即 Collator 接口�?qi��ng)其实现�c�R�?

java.text.RuleBasedCollator

是一个具体类�Q�它实现�?nbsp;Comparator 接口中的 compare(Object, Object) �Ҏ(gu��)��? RuleBasedCollator �Ҏ(gu��)��Ҏ(gu��)��特定语言的默认规则比较字�W�，也可以按照指定的规则来比较，请参�?nbsp;java API 获取此类的详�l�信息�?br /> 如果我们需要对一个有中文的数�l�进行排序，则可以��用这个类。请看如下示例代码：(x��)

import java.util.;

import java.text.;

public class Test

{

        String [] test = new String [] {

                "作业" ,

                "��试" ,

                "test" ,

                "我们" ,

                "。空" ,

                "镂空" ,

                "[" ,

                "��? ,

                "�?

        };

      java.util.Arrays .sort(test,

              (RuleBasedCollator )Collator .getInstance(Locale .CHINA));

      System .out.println("============" );

      for (String key : test)

          System .out.println(key);

}

以上代码的输出结果�ؓ(f��)�Q?br />
============
[
test
。空
��试
我们
作业
��?br /> 镂空
�?br />

大家可能�?x��)发现只有一部分汉字是按照汉语拼��x(ch��ng)��序了(ji��n)�Q�还有几个没有�?/p>

问题分析�Q?/h3>

GB2312:
在简体中文中我们使用比较多的字符集是 GB2312-80�Q�简�U�Cؓ(f��) GB2312�Q�这个字�W�集包含�?ji��n)目前最常用的汉字共�?nbsp;6736 个。其中的汉字分�ؓ(f��)两大�c�：(x��)

常用汉字

�ơ常用汉�?

常用汉字按照汉语拼音来排序，而次常用汉字按照�W�画部首�q�行排序�?br />
��体汉字在 Unicode 中一般是按照 gb2312 的码点值的��序来放�|�的�Q�所以如果是常用汉字 java ��p��够很准确的进行排序，但如果是�ơ常用汉字，则就�?x��)出现问题。在以上�C�Z��中，"�?�Q?�? 属于�ơ常用字�?/p>

解决�Ҏ(gu��)��Q?/h3>

RuleBasedCollator �c?nbsp;getRules() �Ҏ(gu��)��可以�q�回对应语言的规则设�|�。简体中文对应的规则�?nbsp;gb2312 所对应的字�W��?/p>

我们可以把其中的全部汉字提取出来

对这些汉字重新排�?/ol>

利用RuleBasedCollator(String rules) 构造器新徏一个定制的 RuleBasedCollator

参考代�?/h3>

在以下的代码中，我把排过序的汉字直接作�ؓ(f��) String 对象攑֜��c�里面了(ji��n)�Q�如果要让代码变得简�z�一些，则可以把完整的规则（�Ҏ(gu��)��字符�Q�排序汉字）(j��)存�(sh��)ؓ(f��)文�g�?/p>

package sorting;

import java.util.;

import java.text.;

/**

* @author GaoJianMin

*

*/

public class ChineseGB2312Collator

{

    /**

     * @return a customized RuleBasedCollator with Chinese characters (GB2312) sorted correctly

     *

     */

    public static final RuleBasedCollator getFixedGB2312Collator()

    {

        RuleBasedCollator fixedGB2312Collator =null ;

        try

        {

            fixedGB2312Collator = new java.text.RuleBasedCollator (

                    ChineseGB2312Collator.getGB2312SpecialChars() +

                    GB2312Chars

                    );

        }catch (ParseException e)

        {

            e.printStackTrace();

        }

        return fixedGB2312Collator;

    }



    /**

     * @return the special characters in GB2312 charset.

     *

     /

    public static final String getGB2312SpecialChars()

    {

        RuleBasedCollator zh_CNCollator = (RuleBasedCollator )Collator .getInstance(Locale .CHINA);

        //index 2125 is the last symbol "�?*

        return zh_CNCollator.getRules().substring(0,2125);

    }



    /**

     * 6763 Chinese characters in GB2312 charset

     /

    public static final String GB2312Chars =

        "<�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;哀<�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;��?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;��?lt;�?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�? +

        "<�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�W?lt;�_?lt;�?lt;�?lt;�?lt;�?lt;��?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�|?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�E?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�l?lt;�?lt;�?lt;�?lt; �?lt;��?lt;�l?lt;�?lt;膀<�?lt;�?lt;��?lt;�?lt;�?lt;��?lt;�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;��?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�(zh��n)?lt;��?lt;�?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�(zh��n)?lt;�?lt;�?lt;�?lt;�?lt;��?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�W?lt;�?lt;�l?lt;�?lt; �?lt;�?lt;�q?lt;�?lt;�y?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�U?lt; �?lt;�W?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;畀<�?lt;�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�{?lt;�?lt;�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;��?lt;��?lt;�?lt;�?lt;�?lt;��?lt;�?lt;�?lt;��?lt;�?lt;髀< �?lt;�?lt;�?lt;�?lt;�W?lt;�~?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�H?lt;�?lt; ��?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�~?lt;�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�y?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt; �~?lt;�?lt;�?lt;��?lt;�?lt;�?lt;�D?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt; �?lt;�U?lt;�?lt;�?lt;�?lt;��<�q?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�?lt;��?lt;�?lt;�t?lt;�?lt;�C?lt;�?lt;��?lt;�?lt;�?lt; �?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt;�?lt; �?lt;�?lt;�?lt;��? ;

}

package sorting;

import java.util.;

import java.text.*;

/**

* @author GaoJianMin

*

*/

public class ChineseGB2312Comparator implements Comparator <String >, Comparable <String > {

    private RuleBasedCollator GB2312Collator =

        ChineseGB2312Collator.getFixedGB2312Collator();

    private String str1;



    /**

     * @param str1

     */

    public ChineseGB2312Comparator(String str1) {

        this .str1 = str1;

    }

    /**

     *

     */

    public ChineseGB2312Comparator() {

        this .str1="" ;

    }

    /**

     * @param str1

     * @param str2

     * @return an integer indicatint the comparison result

     * @see java.util.Comparator#compare(Object, Object)

     */

    public int compare(String str1, String str2) {

        return GB2312Collator.compare(str1, str2);

    }

    /**

     * @param str2

     * @return an integer indicatint the comparison result

     *  @see java.lang.Comparable#compareTo(Object)

     /

    public int compareTo(String str2) {

        return GB2312Collator.compare(str1, str2);

    }

}

��试代码�?qi��ng)结�?/h3>
代码�Q?br />

import java.util.;

import java.text.*;

public class Test

{

        String [] test = new String [] {

                "作业" ,

                "��试" ,

                "test" ,

                "我们" ,

                "。空" ,

                "镂空" ,

                "[" ,

                "��? ,

                "�?

        };

      java.util.Arrays .sort(test, new ChineseGB2312Comparator());

      System .out.println("============" );

      for (String key : test)

          System .out.println(key);

}

ChineseGB2312Comparator �c�d��时实��C��(ji��n) Comparator, Comparable 接口�Q�这样以后能够��?nbsp;compare, compareTo �Ҏ(gu��)��的时候都可以使用�q�个�c�R�?/span>

��菜毛毛 2010-12-17 13:22 发表评论

��菜毛毛 — Tue, 19 Oct 2010 14:32:00 GMT

javac -classpath的��用：(x��)

javac�Q�如果当前你要编译的java文�g中引用了(ji��n)其它的类(比如��_(d��)��(x��)�l�承)�Q�但该引用类�?class文�g不在当前目录下，�q�种情况下就需要在javac命��o(h��)后面加上-classpath参数�Q�通过使用以下三种�c�d��的方�?来指导编译器在编译的时候去指定的�\径下查找引用�c�R�?/span>

(1).�l�对路径�Q�javac -classpath c:\junit3.8.1\junit.jar   Xxx.java
(2).相对路径�Q�javac -classpath ..\junit3.8.1\Junit.javr Xxx.java
(3).�pȝ��变量�Q�javac -classpath %CLASSPATH% Xxx.java (注意�Q?CLASSPATH%表示使用�pȝ��变量CLASSPATH的��D��行查找，�q�里假设Junit.jar的�\径就包含在CLASSPATH�pȝ��变量�?

javac �l�对路径的��用：(x��)

javac�Q�假设你要编译的�c�L��件名叫：(x��)HelloWorld.java�Q�其完全路径为：(x��)D:\java\HelloWorld.java。但你所在的当前目录是：(x��)C:\Documents and Settings\peng>。如果想在这里执行编译，�?x��)有什么结果呢�Q?/span>

(1).C:\Documents and Settings\peng> javac HelloWorld.java �q�时�~�译器会(x��)�l�出如下的错误提�C�Z��息：(x��)
error: cannot read: HelloWorld.java
�q�是因�ؓ(f��)默认情况下javac是在当前目录下查扄��文�g�Q�很明显�q�个路径不是我们存放�c�L��件的地方�Q�所以就�?x��)报错�?ji��n)

(2).C:\Documents and Settings\peng>javac D:\java\HelloWorld.java
�q�时�~�译成功�?/span>
所以，只要你执行javac命��o(h��)的目录不是类文�g存放的目录，你就必须在javac命��o(h��)中显式地指定�c�L��件的路径�?/span>

java -classpath的��用：(x��)

java�Q�假设我们的CLASSPATH讄��为：(x��)D:\peng\java\pro �Q�在该目录下有三个文�Ӟ��(x��)HelloWorld.java / HelloWorldExtendsTestCase / HelloWorldExtendsHelloWorld。这三个文�g的类声明分别如下�Q?/span>

HelloWorld.java �Q�public class HelloWorld
HelloWorldExtendsHelloWorld.java �Q�public class HelloWorldExtendsHelloWorld extends HelloWorld
HelloWorldExtendsTestCase.java�Q�public class HelloWorldExtendsTestCase extends junit.framework.TestCase

      假设我们已经按照上面关于javac -classpath和javac �l�对路径的��用，��利地完成了(ji��n)三个文�g地编译。现在我们在C:\Documents and Settings\peng>目录下执行这三个.class文�g

(1).C:\Documents and Settings\peng>java HelloWorld
      Hello World

可以看到执行成功。�ؓ(f��)什么我们在 C:\Documents and Settings\peng>执行命��o(h��)�Q�JVM能够扑ֈ�D:\peng\java\pro\HelloWorld.class文�g呢？�q�是因�ؓ(f��)我们配置�?ji��n)系�l�变量CLASSPATH�Q��ƈ且指向了(ji��n)目录�Q�D:\peng\java\pro 。所以JVM�?x��)默认去该目录下加蝲�c�L��Ӟ��而不需要指�?class文�g的绝对�\径了(ji��n)�?/span>

(2).C:\Documents and Settings\peng>java HelloWorldExtendsHelloWorld
       Hello World

可以看到执行成功�?ji��n)。HelloWorldExtendsHelloWorld�l�承�?ji��n)HelloWorld�c�，所以在执行时JVM�?x��)先查找在CLASSPATH下是否存在一个HelloWorld.class文�g�Q�因为我们已�l�成功编译了(ji��n)HelloWorld �c�M��(ji��n)�Q�所以可以成功执行HelloWorldExtendsHelloWorld.class

(3).C:\Documents and Settings\peng>java HelloWorldExtendsTestCase
     Exception in thread "main" java.lang.NoClassDefFoundError: junit/framework/TestCase

可以看到�E�序抛出异常�?ji��n)，提示找不到junit.framework.TestCase文�g。�ؓ(f��)什么同样在:\peng\java\pro 下，HelloWorldExtendsHelloWorld.class��可以成功执行，而这个就不行�?ji��n)呢�Q�这是因为：(x��)            junit.framework.TestCase.class文�g�q�不存在于当前目录下�Q�所以�ؓ(f��)�?ji��n)能够让�E�序成功�q�行�Q�我们必��通过指定CLASSPATH的方式，让JVM可以扑ֈ�junit.framework.TestCase�q�个�c�，�?4)�Q?/span>

(4). C:\Documents and Settings\peng>java -classpath %CLASSPATH% HelloWorldExtendsTestCase
      Hello World

�ȝ��Q?/span>

(1).何时需要��?classpath�Q�当你要�~�译或执行的�c�d��用了(ji��n)其它的类�Q�但被引用类�?class文�g不在当前目录下时�Q�就需要通过-classpath来引入类
(2).何时需要指定�\径：(x��)当你要编译的�c�L��在的目录和你执行javac命��o(h��)的目录不是同一个目录时�Q�就需要指定源文�g的�\�?CLASSPATH是用来指�?class路径的，不是用来指定.java文�g的�\径的)

[转自�Q?/span>
http://blog.csdn.net/pengpenglin/
http://www.aygfsteel.com/pengpenglin/
]

��菜毛毛 2010-10-19 22:32 发表评论

JAVAC 命��o(h��)详解(http://www.cnblogs.com/jeffchen/archive/2008/01/16/1041783.html)

��菜毛毛 — Tue, 19 Oct 2010 14:31:00 GMT

�l�构

javac [ options ] [ sourcefiles ] [ @files ]

参数可按��L��ơ序排列�?/p>
说明 javac 有两�U�方法可��源代码文�g名传递给 javac�Q?/p> 如果源文件数量少�Q�在命��o(h��)行上列出文�g名即可�?/li> 如果源文件数量多�Q�则��源文�g名列在一个文件中�Q�名�U�间用空格或回�R行来�q�行分隔。然后在 javac 命��o(h��)行中使用该列表文件名�Q�文件名前冠�?@ 字符�?/li> 源代码文件名�U�必��d��?nbsp;内部�c�d��义��生附加的�c�L��件。这些类文�g的名�U�将内部�c�d��外部�cȝ��名称�l�合在一��P��例如应当��源文�g安排在反映其包树(w��i)�l�构的目录树(w��i)中。例如，如果��所有的源文件放�?/workspace 中，那么 �~�省情况下，�~�译器将每个�c�L��件与其源文�g攑֜�同一目录中。可�?-d 选项�Q�请参阅后面�?/a>选项�Q�指定其它目标目录�?/a> 工具��d��?Java �~�程语言�~�写的类和接口定义，�q�将它们�~�译成字节码�c�L��件�?/a> 查找�c�d�� 当编译源文�g�Ӟ��~�译器常帔R��要它�q�没有识别出的类型的有关信息。对于源文�g中��用、扩展或实现的每个类或接口，�~�译器都需要其�c�d��信息。这包括在源文�g中没有明��提�?qi��ng)、但通过�l�承提供信息的类和接口�?/p> 例如�Q�当扩展 java.applet.Applet 时还要用�?nbsp;Applet 的祖先类�Q?strong>java.awt.Panel �?strong>java.awt.Container�?nbsp;java.awt.Component �?nbsp;java.awt.Object�?/p> 当编译器需要类型信息时�Q�它?y��u)��查扑֮�义类型的源文件或�c�L��件。编译器先在自�D�c�d��(qi��ng)扩展�c�M��查找�Q�然后在用户�c��\径中查找。用��L(f��ng)��路径通过两种途径来定义：(x��)通过讄�� CLASSPATH 环境变量或��?nbsp;-classpath 命��o(h��)行选项。（有关详细资料�Q�请参阅讄��c��\径）(j��)。如果��?nbsp;-sourcepath 选项�Q�则�~�译器在 sourcepath 指定的�\径中查找源文�Ӟ��否则�Q�编译器��在用户�c��\径中查找�c�L��件和源文件。可�?strong>-bootclasspath �?nbsp;-extdirs 选项来指定不同的自�D�c�L��扩展�c�；参阅下面的联�~�选项�?/p> 成功的类型搜索可能生成类文�g、源文�g或两者兼有。以下是 javac 对各�U�情形所�q�行的处理：(x��) 搜烦(ch��)�l�果只生成类文�g而没有源文�g�Q?/em> javac 使用�c�L��件�?/li> 搜烦(ch��)�l�果只生成源文�g而没有类文�g�Q?/em> javac �~�译源文件�ƈ使用由此生成的类文�g�?/li> 搜烦(ch��)�l�果既生成源文�g又生成类文�g�Q?strong> ��定�c�L��件是否过时。若�c�L��件已�q�时�Q�则 javac重新�~�译源文件�ƈ使用更新后的�c�L��件。否则， javac 直接使用�c�L��件�? �~�省情况下，只要�c�L��件比源文件旧�Q?nbsp;javac ��p��为它已过时。（ -Xdepend 选项指定相对来说较慢但却比较可靠的过�E�。）(j��) javac 注意�Q?nbsp;javac 可以隐式�~�译一些没有在命��o(h��)行中提及(qi��ng)的源文�g。用 -verbose 选项可跟�t�自动编译�?/p> 文�g列表为羃短或��?nbsp;@' 字符加上文�g名的�Ҏ(gu��)��它指定为文件列表。当 javac 遇到�?`例如�Q�可以在名�ؓ(f��) MyClass1.java MyClass2.java MyClass3.java 然后可用下列命��o(h��)�q�行�~�译器：(x��) C:> javac @sourcefiles 选项 �~�译器有一�Ҏ(gu��)��准选项�Q�目前的开发环境支持这些标准选项�Q�将来的版本也将支持它。还有一扚w��加的非标准选项是目前的虚拟机实现所�Ҏ(gu��)��的，��来可能要有变化。非标准选项�?nbsp;-X 打头�?/p> 标准选项 -classpath �c��\�?/em> 讄��用户�c��\径，它将覆盖 CLASSPATH 环境变量中的用户�c��\径。若既未指定CLASSPATH 又未指定 -classpath�Q�则用户�c��\径由当前目录构成。有兌��l�信息，请参阅设�|�类路径�? 若未指定 -sourcepath 选项�Q�则��在用户�c��\径中查找�c�L��件和源文件�?/p> -d 目录讄��c�L��件的目标目录。如果某个类是一个包的组成部分，�?nbsp;javac ��把该类文�g攑օ�反映包名的子目录中，必要时创建目录。例如，如果指定 -d c:\myclasses �q�且该类名叫若未指定 -d 选项�Q�则 javac ��把�c�L��件放��C��源文件相同的目录中�?/p> 注意�Q?nbsp;-d 选项指定的目录不�?x��)被自动��d��到用��L(f��ng)��路径中�?/p> -deprecation 昄��每种不鼓�׃��用的成员或类的��用或覆盖的说明。没有给�?nbsp;-deprecation 选项的话�Q?nbsp;javac ��显�C��c�L��文�g的名�U�ͼ�(x��)�q�些源文件��用或覆盖不鼓�׃��用的成员或类�?/dd> -encoding 讄��源文件编码名�U�ͼ�例如 �?JDK 1.2 以前的版本中�Q�javac �?nbsp;-g 选项�?nbsp;-O 选项不能一起��用。在 JDK 1.2 中，可以��?nbsp;-g �?nbsp;-O 选项�l�合��h��Q�但可能�?x��)得到意想不到的�l�果�Q�如丢失变量或重新定位代码或丢失代码�?strong>-O 选项不再自动打开 -depend 或关�?nbsp;-g 选项。同��P�� -O 选项也不再允许进行跨�c�d��嵌�?/p> -sourcepath 源�\�?/em> 指定用以查找�c�L��接口定义的源代码路径。与用户�c��\径一��P��源�\径项用分�?(;) �q�行分隔�Q�它们可以是目录、JAR 归档文�g�?ZIP 归档文�g。如果��用包�Q�那么目录或归档文�g中的本地路径名必��d��映包名�? 注意�Q�通过�c��\径查扄��c�，如果扑ֈ��?ji��n)其源文�Ӟ��则可能�?x��)自动被重新编译�?/p> -verbose 冗长输出。它包括�?ji��n)每个所加蝲的类和每个所�~�译的源文�g的有关信息�?/dd> 联编选项 �~�省情况下，�c�L��Ҏ(gu��)��?nbsp;javac 一起发行的 JDK 自�D�c�d��扩展�c�L��~�译。但 javac 也支�?em>联编�Q�在联编中，�c�L��Ҏ(gu��)��其它 Java�q�_��实现的自丄��和扩展类来进行编译的。联�~�时�Q?nbsp;-bootclasspath �?nbsp;-extdirs 的��用很重要�Q�请参阅下面的联�~�程序示例�?/p> -target 版本生成��在指定版本的虚拟机上运行的�c�L��件。缺省情况下生成�?1.1 �?1.2 版本的虚拟机都兼容的�c�L��件。JDK 1.2 中的 javac 所支持的版本有�Q?dl> 1.1 保证所产生的类文�g�?1.1 �?1.2 版的虚拟机兼宏V��这是缺省状态�?/dd> 1.2 生成的类文�g可在 1.2 版的虚拟��Z��q�行�Q�但不能�?1.1 版的虚拟��Z��q�行�?/dd> -bootclasspath 自�D�c��\�?/em> �Ҏ(gu��)��指定的自丄��集进行联�~�。和用户�c��\径一��P��自�D�c��\径项用分�?(;) �q�行分隔�Q�它们可以是目录、JAR 归档文�g�?ZIP 归档文�g�?/dd> -extdirs 目录 �Ҏ(gu��)��指定的扩展目录进行联�~��?em>目录是以分号分隔的目录列表。在指定目录的每�?JAR 归档文�g中查扄��文�g�?/dd>
非标准选项 -X 昄��非标准选项的有关信息�ƈ退出�?/dd> -Xdepend 递归地搜索所有可获得的类�Q�以��L��要重�~�译的最新源文�g。该选项��更可靠地查��N��要编译的�c�，但会(x��)使编译进�E�的速度大�ؓ(f��)减慢�?/dd> -Xstdout ��编译器信息送到注意�Q?nbsp;CLASSPATH �?nbsp;-classpath �?nbsp;-bootclasspath �?nbsp;-extdirs �q?nbsp;�?/em> 指定用于�q�行 javac 的类。如此滥用编译器的实现通常没有��M��意义而且��L��很危险的。如果确实需要这样做�Q�可�?nbsp;-J 选项��选项传给基本�?nbsp;java 启动器�?/p> �E�序�C�Z�� ~�译��单程�?/h3> 一个源文�g C:> dir greetings/ C:> dir greetings Hello.java C:> cat greetings\Hello.java package greetings; public class Hello { public static void main(String[] args) { for (int i=0; i < args.length; i++) { System.out.println("Hello " + args[i]); } } } C:> javac greetings\Hello.java C:> dir greetings Hello.class Hello.java C:> java greetings.Hello World Universe Everyone Hello World Hello Universe Hello Everyone

�~�译多个源文�?/h3> 该示例编�?nbsp; C:> dir greetings\ C:> dir greetings Aloha.java GutenTag.java Hello.java Hi.java C:> javac greetings\*.java C:> dir greetings Aloha.class GutenTag.class Hello.class Hi.class Aloha.java GutenTag.java Hello.java Hi.java 指定用户�c��\�?/h3> 对前面示例中的某个源文�g�q�行更改后，重新�~�译它：(x��) C:> cd \examples C:> javac greetings\Hi.java �׃�� C:>javac -classpath \examples \examples\greetings\Hi.java 如果再次��?nbsp; C:>javac -classpath \examples:\lib\Banners.jar \ \examples\greetings\Hi.java 要执�?nbsp; C:>java -classpath \examples:\lib\Banners.jar greetings.Hi ��源文�g和类文�g分开 ��源文�g和类文�g�|�于不同的目录下�l�常是很有意义的�Q�特别是在大型的��目中。我们用 -d 选项来指明单独的�c�L��件目标位�|�。由于源文�g不在用户�c��\径中�Q�所以用 -sourcepath 选项来协助编译器查找它们�?/p> C:> dir classes\ lib\ src\ C:> dir src farewells\ C:> dir src\farewells Base.java GoodBye.java C:> dir lib Banners.jar C:> dir classes C:> javac -sourcepath src -classpath classes:lib\Banners.jar \ src\farewells\GoodBye.java -d classes C:> dir classes farewells\ C:> dir classes\farewells Base.class GoodBye.class 注意�Q�编译器也编译了(ji��n) 联编�E�序�C�Z�� q�里我们�?JDK 1.2 �?nbsp;javac 来编译将�?1.1 版的虚拟��Z��q�行的代码�?/p> C:> javac -target 1.1 -bootclasspath jdk1.1.7\lib\classes.zip \ -extdirs "" OldCode.java -target 1.1 JDK 1.2 javac 在缺省状态下也将�Ҏ(gu��)�� 1.2 版的自�D�c�L��q�行�~�译�Q�因此我们需要告�?strong>javac 让它�Ҏ(gu��)�� JDK 1.1 自�D�c�L��q�行�~�译。可�?nbsp;-bootclasspath �?nbsp;-extdirs 选项来达到此目的。不�q�样做的话，可能�?x��)�ɾ~�译器根�?1.2 版的 API 来进行编译。由�?1.1 版的虚拟��Z��可能没有�?1.2 版的 API�Q�因此运行时��出错�?/p> 选项可确保生成的�c�L��件与 1.1 版的虚拟机兼宏V��在 JDK1.2 中， �~�省情况�?nbsp;javac �~�译生成的文件是�?1.1 版的虚拟机兼容的�Q�因此�ƈ非严格地需要该选项。然而，�׃��别的�~�译器可能采用其它的�~�省讄��Q�所以提供这一选项��不�׃ؓ(f��)是个好习(f��n)惯�?/blockquote> ��菜毛毛 2010-10-19 22:31 发表评论

��菜毛毛 — Tue, 19 Oct 2010 09:07:00 GMT 下面的讨��Z��Windows�q�_��的Sun MicroSystem实现的java5虚拟��Zؓ(f��)蓝本�Q�其他操作系�l�或其他公司实现的虚拟机参数�?x��)有部分不同�Q�但大部分含义都和W(xu��)indows上的�c�M��。Java5与以前版本相比，虚拟机参数大部分保持�?ji��n)向前兼容，同时也增加�?ji��n)一些新的参敎ͼ�本文��对�q�些参数的作用作详细描述�Q��虚拟��更符合运行环境的需要，获得更好的性能和稳定性�?/p> Java在运行已�~�译完成的类�Ӟ��是通过java虚拟机来装蝲和执行的�Q�java虚拟机通过操作�pȝ��命��o(h��)JAVA_HOME\bin\java –option 来启动，-option��拟机参数�Q�JAVA_HOME为JDK安装路径�Q�通过�q�些参数可对虚拟机的�q�行状态进行调��_(d��)��掌握参数的含义可对虚拟机的运行模式有更深入理解�?br /> 虚拟机参数分为基本和扩展两类�Q�在命��o(h��)行中输入JAVA_HOME\bin\java ��可得到基本参数列表�Q?br /> 在命令行输入JAVA_HOME\bin\java –X ��可得到扩展参数列表�?br /> 基本参数说明�Q?br /> -client�Q?server �q�两个参数用于设�|�虚拟机使用何种�q�行模式�Q�client模式启动比较快，但运行时性能和内存管理效率不如server模式�Q�通常用于客户端应用程序。相反，server模式启动比client慢，但可获得更高的运行性能�?br /> 在windows上，�~�省的虚拟机�c�d��为client模式�Q�如果要使用server模式�Q�就需要在启动虚拟机时�?server参数�Q�以获得更高性能�Q�对服务器端应用�Q�推荐采用server模式�Q�尤其是多个CPU的系�l�。在Linux�Q�Solaris上缺省采用server模式�?br /> -hotspot 含义与client相同�Q�jdk1.4以前使用的参敎ͼ�jdk1.4开始不再��用，代之以client�?br /> -classpath,-cp 虚拟机在�q�行一个类�Ӟ��需要将其装入内存，虚拟机搜索类的方式和��序如下�Q?br /> Bootstrap classes�Q�Extension classes�Q�User classes�?br /> Bootstrap 中的路径是虚拟机自带的jar或zip文�g�Q�虚拟机首先搜烦(ch��)�q�些包文�Ӟ��用System.getProperty("sun.boot.class.path")可得到虚拟机搜烦(ch��)的包名�?br /> Extension是位于jre\lib\ext目录下的jar文�g�Q�虚拟机在搜索完Bootstrap后就搜烦(ch��)该目录下的jar文�g。用System. getProperty("java.ext.dirs”)可得到虚拟机使用Extension搜烦(ch��)路径�?br /> User classes搜烦(ch��)��序为当前目录、环境变�?CLASSPATH�?classpath�?br /> -classpath告知虚拟机搜索目录名、jar文档名、zip文档名，之间用分�?分隔�?br /> 例如当你自己开发了(ji��n)公共�c�dƈ包装成一个common.jar包，在��用common.jar中的�c�L��Q�就需要用-classpath common.jar 告诉虚拟��Z��common.jar中查找该�c�，否则虚拟机就�?x��)抛出java.lang.NoClassDefFoundError异常�Q�表明未扑ֈ��c�d��义�?br /> 在运行时可用System.getProperty(“java.class.path”)得到虚拟机查扄��的�\径�?br /> 使用-classpath后虚拟机��不再��用CLASSPATH中的�c�L��索�\径，如果-classpath和CLASSPATH都没有设�|�，则虚拟机使用当前路径(.)作�ؓ(f��)�c�L��索�\径�?br /> 推荐使用-classpath来定义虚拟机要搜索的�c��\径，而不要��用环境变量CLASSPATH的搜索�\径，以减��多个项目同时��用CLASSPATH时存在的潜在冲突。例如应�?要��用a1.0.jar中的�c�G�Q�应�?要��用a2.0.jar中的�c�G,a2.0.jar是a1.0.jar的升�U�包�Q�当a1.0.jar�Q�a2.0.jar都在CLASSPATH中，虚拟机搜索到�W�一个包中的�c�G时就停止搜烦(ch��)�Q�如果应�?应用2的虚拟机都从CLASSPATH中搜索，��׃��(x��)有一个应用得不到正确版本的类G�?br /> -D=value 在虚拟机的系�l�属性中讄��属性名/值对�Q�运行在此虚拟机之上的应用程序可用System.getProperty(“propertyName”)得到value的倹{�?br /> 如果value中有�I�格�Q�则需要用双引号将该值括��h��Q�如-Dname=”space string”�?br /> 该参数通常用于讄��pȝ��U�全局变量��|��如配�|�文件�\径，应�ؓ(f��)该属性在�E�序中�Q何地斚w��可访问�?br /> -verbose[:class|gc|jni] 在输�?gu��)��备上昄��虚拟��行信息�?br /> verbose和verbose:class含义相同�Q�输�?gu��)��拟机装入的类的信息，昄��的信息格式如下�?x��) [Loaded java.io.FilePermission$1 from shared objects file] 当虚拟机报告�c�L��不到或类冲突时可用此参数来诊断来查看虚拟��Z��装入�cȝ��情况�?br /> -verbose:gc在虚拟机发生内存回收时在输出讑֤�昄��信息�Q�格式如下：(x��) [Full GC 268K->168K(1984K), 0.0187390 secs] 该参数用来监视虚拟机内存回收的情��c(di��n)�?br /> -verbose:jni在虚拟机调用native�Ҏ(gu��)��时输�?gu��)��备显�C�Z��息，格式如下�Q?br /> [Dynamic-linking native method HelloNative.sum ... JNI] 该参数用来监视虚拟机调用本地�Ҏ(gu��)��的情况，在发生jni错误时可��断提供便利�?br /> -version 昄��可运行的虚拟机版本信息然后退出。一台机器上装有不同版本的JDK�?br /> -showversion 昄��版本信息以及(qi��ng)帮助信息�?br /> -ea[:...|:] -enableassertions[:...|:] 从JDK1.4开始，java可支持断�a�机制�Q�用于诊断运行时问题。通常在测试阶�D��断言有效�Q�在正式�q�行时不需要运行断�a�。断�a�后的表达式的值是一个逻辑��|��为true时断�a�不运行，为false时断�a��q�行�Q�抛出java.lang.AssertionError错误�?br /> 上述参数��q��来设�|�虚拟机是否启动断言机制�Q�缺省时虚拟机关闭断�a�机制�Q�用-ea可打开断言机制�Q�不�?lt;packagename>和classname时运行所有包和类中的断言�Q�如果希望只�q�行某些包或�c�M��的断�a��Q�可��包名或�c�d��加到-ea之后。例如要启动包com.foo.util中的断言�Q�可用命�?–ea:com.foo.util �?br /> -da[:...|:] -disableassertions[:...|:] 用来讄��虚拟机关闭断�a�处理�Q�packagename和classname的��用方法和-ea相同�?br /> -esa | -enablesystemassertions 讄��虚拟机显�C�系�l�类的断�a��?br /> -dsa | -disablesystemassertions 讄��虚拟机关闭系�l�类的断�a��?br /> -agentlib:[=] 该参数是JDK5新引入的�Q�用于虚拟机装蝲本地代理库�?br /> Libname为本��C��理库文�g名，虚拟机的搜烦(ch��)路径为环境变量PATH中的路径�Q�options��Z��l�本地库启动时的参数�Q�多个参��C��间用逗号分隔。在Windows�q�_��上虚拟机搜烦(ch��)本地库名为libname.dll的文�Ӟ��在Unix上虚拟机搜烦(ch��)本地库名为libname.so的文�Ӟ��搜烦(ch��)路径环境变量在不同系�l�上有所不同�Q�Linux、SunOS、IRIX上�ؓ(f��)LD_LIBRARY_PATH�Q�AIX上�ؓ(f��)LIBPATH�Q�HP-UX上�ؓ(f��)SHLIB_PATH�?br /> 例如可��?agentlib:hprof来获取虚拟机的运行情况，包括CPU、内存、线�E�等的运行数据，�q�可输出到指定文件中�Q�可�?agentlib:hprof=help来得��C��用帮助列表。在jre\bin目录下可发现hprof.dll文�g�?br /> -agentpath:[=] 讄��虚拟机按全�\径装载本地库�Q�不再搜索PATH中的路径。其他功能和agentlib相同�?br /> -javaagent:[=] 虚拟机启动时装入java语言讑֤�代理。Jarpath文�g中的mainfest文�g必须有Agent-Class属性。代理类要实现public static void premain(String agentArgs, Instrumentation inst)�Ҏ(gu��)��。当虚拟机初始化�Ӟ��按代理�cȝ��说明��序调用premain�Ҏ(gu��)��?br /> 参见�Q�java.lang.instrument 扩展参数说明 -Xmixed 讄��-client模式虚拟机对使用频率高的方式�q�行Just-In-Time�~�译和执行，对其他方法��用解释方式执行。该方式是虚拟机�~�省模式�?br /> -Xint 讄��-client模式下运行的虚拟��Z��解释方式执行�cȝ��字节码，不将字节码编译�ؓ(f��)本机码�?br /> -Xbootclasspath:path -Xbootclasspath/a:path -Xbootclasspath/p:path 改变虚拟��载缺省系�l�运行包rt.jar而从-Xbootclasspath中设定的搜烦(ch��)路径中装载系�l�运行类。除非你自己能写一个运行时�Q�否则不�?x��)用到该参数�?br /> /a:��在�~�省搜烦(ch��)路径后加上path 中的搜烦(ch��)路径�?br /> /p:在缺省搜索�\径前先搜索path中的搜烦(ch��)路径�?br /> -Xnoclassgc 关闭虚拟机对class的垃圑֛�收功能�?br /> -Xincgc 启动增量垃圾攉��器，�~�省是关闭的。增量垃圾收集器能减��偶然发生的长时间的垃圾回收造成的暂停时间。但增量垃圾攉��器和应用�E�序�q�发执行�Q�因此会(x��)占用部分CPU在应用程序上的功能�?br /> -Xloggc: ��虚拟机每次垃圾回收的信息写到日志文件中�Q�文件名由file指定�Q�文件格式是�q�x(ch��ng)��Ӟ��内容�?verbose:gc输出内容相同�?br /> -Xbatch 虚拟机的�~�省�q�行方式是在后台�~�译�c�M��码，然后在前台执行代码，使用-Xbatch参数��关闭虚拟机后台�~�译�Q�在前台�~�译完成后再执行�?br /> -Xms 讄��虚拟机可用内存堆的初始大��，�~�省单位为字节，该大��ؓ(f��)1024的整数倍�ƈ且要大于1MB�Q�可用k(K)或m(M)为单位来讄��较大的内存数。初始堆大小�?MB�?br /> 例如�Q?Xms6400K�Q?Xms256M -Xmx 讄��虚拟机内存堆的最大可用大��，�~�省单位为字节。该值必��Mؓ(f��)1024整数倍，�q�且要大�?MB。可用k(K)或m(M)为单位来讄��较大的内存数。缺省堆最大��gؓ(f��)64MB�?br /> 例如�Q?Xmx81920K�Q?Xmx80M 当应用程序申请了(ji��n)大内存运行时虚拟机抛出java.lang.OutOfMemoryError: Java heap space错误�Q�就需要��?Xmx讄��较大的可用内存堆�?br /> -Xss 讄��U�程栈的大小�Q�缺省单位�ؓ(f��)字节。与-Xmx�c�M��Q�也可用K或M来设�|�较大的倹{��通常操作�pȝ��分配�l�线�E�栈的缺省大��ؓ(f��)1MB�?br /> 另外也可在java中创建线�E�对象时讄��栈的大小�Q�构造函数原型�ؓ(f��)Thread(ThreadGroup group, Runnable target, String name, long stackSize)�?br /> -Xprof 输出CPU�q�行时的诊断信息�?br /> -Xfuture 对类文�g�q�行严格格式��(g��)查，以保证类代码�W�合�c�M��码规范。�ؓ(f��)保持向后兼容�Q�虚拟机�~�省不进行严格的格式��(g��)查�?br /> -Xrs 减少虚拟��Z��操作�pȝ��的信��P��singals�Q�的使用。该参数通常用在虚拟��Z��后台服务方式�q�行时��用（如Servlet�Q��?br /> -Xcheck:jni 调用JNI函数时进行附加的��(g��)查，特别地虚拟机��校验传递给JNI函数参数的合法性，在本��C��码中遇到非法数据�Ӟ��虚拟机将报一个致命错误而终止。��用该参数后将造成性能下降�?/p> ��菜毛毛 2010-10-19 17:07 发表评论 ��菜毛毛 — Wed, 02 Jun 2010 07:31:00 GMT http://homelink.javaeye.com/blog/293328#comments 参考文�?http://www.ibm.com/developerworks/cn/web/wa-lo-comet/ comet是HTTP长连接，��是在HTTP发送请求时�Q�服务器不立��d��送响应信息给客户端，而是保持着�q�接�Q�等待一定情况发生后才把数据发送回�ȝ��客户端。所以用comet可以实现服务器端的数据实时地发送给客户端�?/p> 本文主要是用java和js来简单地实现comet�Q�最后附上源码和使用例子�?/p> 在客��L(f��ng)��用XMLRequest发送请求到服务器，在服务器端用一个servlet来接收XMLRequest的请求，当接收到�? 求时�Q��ƈ不立��d��应客��L(f��ng)��Q�而是把该servlet�U�程��d��Q�等��C��定事件发生后�Q�再响应客户端。当客户端接收到服务端的响应后，调用自定义的回调函数�? 处理服务器发送回来的数据�Q�处理完成后�Q�再发送一个XMLRequest��h��到服务端�Q�这样��@环下去，��可以实现数据的实时更新�Q�又不必要在客户端不断地轮��@�Q�polling�Q��?/p> 利用该comet的实玎ͼ�以后��U�Cؓ(f��)keeper�Q�时�Q�只要在客户端注册事件和写一个处理返回数据的回调函数�Q�然后在服务端实�? keeper中的EventListener接口�Q�调用Controller.action(eventListener,eventType)��可�? �?ji��n)�?/p> keeper分成两大部分�Q�第一部分为客��L(f��ng)��的javascript,�W�二部分是服务端的servlet和事件处理�?/p> 一.客户�?/p> 建立一个XMLRequest对象池，每发送一�ơ请求，从对象池中取一个XMLRequest对象�Q�如果没有可用的对象�Q�则创徏一个，把它加入到对象池中。这部分的代码来自于�|�络�?/p> ��Z��(ji��n)使用方便�Q�再��d��一些方法，用来注册事�g。这样只要调用注册函数来注册事�g�Q��ƈ且把回调函数传给注册事�g函数��p��?ji��n)，处理数�? 的事情，交给回调函数�Q��ƈ��q��h��实现�?/p> keeper��Z��(ji��n)方便使用�Q�把客户端的javascript代码集成在servlet中，当配�|�好keeper的servlet�Q? 启动HTTP服务器时�Q�keeper�?x��)根据用��L(f��ng)��配置�Q�在相应的目录下生成客户端的javascript代码�?/p> �?服务�?/p> 服务端的servlet初始化时�Q�根据配�|�来生成相应的客��L(f��ng)��javascript代码�?/p> servlet的入口由keeper.servlet.Keeper.java中的doGet�q�入。在Keeper的doGet 中，从请求中获取用户注册事�g的名�U�ͼ�字符串类型）(j��)�Q�然后根据事件的名称�Q�构造一个事�Ӟ��Event�c�d��Q�，再把它注册到NameRegister中，�? 册完成后�Q�该servlet�U�程调用wait(),把自已停止。等待该servlet�U�程被唤醒后�Q�从Event中调用事件的EventListener 接口的process(request,response)来处理客��L(f��ng)��的请求�?/p> protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { String eventName = request.getParameter("event"); NameRegister reg = NameRegister.getInstance(); Event event = null; try { event = reg.getEvent(eventName); if(event == null) { event = new Event(eventName,this); reg.registeEvent(eventName, event); } if(event.getServlet() == null) { event.setServlet(this); } } catch (RegistException e1) { e1.printStackTrace(); } synchronized(this) { while(!event.isProcess()) { try { wait(); } catch (InterruptedException e) { e.printStackTrace(); } } } EventListener listener = event.getListener(); if(listener != null) { listener.process(request,response); } } 在服务端处理事�g�Ӟ��调用�?ji��n)keeper.control.Controller中的�?r��n)态方�? action(EventListener listener,String eventName)来处理。如下所�C��?/span> public static boolean action(EventListener listener,String eventName){ NameRegister reg = NameRegister.getInstance(); HttpServlet servlet = null; Event e = null; try { e = reg.getEvent(eventName,true); if(e == null) { return false; } e.setListener(listener); servlet = e.getServlet(); e.setProcess(true); synchronized(servlet) { servlet.notifyAll(); } } catch (RegistException ex) { ex.printStackTrace(); } if(servlet != null && e != null) { e = null; return true; } else { return false; } } 下面开始用keeper来写一个简单的�|�页聊天�E�序和基于服务端的时间�?/p> 1.客户端设�|?/span> 注册两个事�g�Q�一个用于是旉��事�g�Q�一个是消息事�g。同时还要写两个回调函数�Q�用于处理服�? 端返回的旉��和聊天消息。如下所于：(x��) Keeper.addListener('timer',showTime);//注册旉��事�g function showTime(obj){ //旉��处理回调函数 var sp = document.getElementById("dateTime"); if(sp){ sp.innerHTML = obj.responseText; } } function startOrStop(obj){ var btn = document.getElementById("controlBtn") btn.value=obj.responseText; } Keeper.addListener('msg',showMsg,"GBK");//注册消息�? �Ӟ��最后一个参数是 //字符串编�? function showMsg(obj){//处理消息的回调函�? var msg = document.getElementById("msg"); if(msg){ msg.value = obj.responseText+""n"+msg.value; } } function sendMsg() { var msg = document.getElementById("sendMsg"); if(msg){ var d = "msg="+msg.value; sendReq('POST','./demo',d,startOrStop); msg.value = ""; } } 2.配置服务�?/span> 服务端的配置�? web.xml文�g中，如下所�C?/span> keeper keeper.servlet.Keeper ScriptName /keeperScript.js 1 keeper /keeper �?lt;script type="text/javascript" src="./keeperScript.js">在页面包含JavaScript�Ӟ��q�里的src一定要和上面配 �|�的一臟뀂上面的讄��除了(ji��n)为可选的讄��外，其他的都是必要的�Q�而且不能�? 变�?/p> 3.�~�写事�g处理代码�Q�消息的处理代码如下�Q?/span> protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { System.out.println("Post.."); String msg = request.getParameter("msg"); Controller.action(new SendMsg(msg),"msg"); } class SendMsg implements EventListener{ private String msg; public SendMsg(String msg) { this.msg = msg; } @Override public void process(HttpServletRequest request, HttpServletResponse response) { response.setCharacterEncoding("UTF-8"); PrintWriter out = null; try { out = response.getWriter(); if(msg!=null){ out.write(msg); } } catch (IOException e) { e.printStackTrace(); } finally{ if(out != null) { out.close(); } } } } 到这�Ӟ��一个基本的keeper应用��完成了(ji��n)。其它部分请参考附件中的例子源码�?/p> Keeper_KeeperDemo.rar (36 KB) 描述: comet的实现和应用例子下蝲�ơ数: 767 ��菜毛毛 2010-06-02 15:31 发表评论字符�Q�字节和�~�码 ��菜毛毛 — Fri, 30 Apr 2010 03:15:00 GMT 字符�Q�字节和�~�码转蝲自：(x��)http://www.regexlab.com/zh/encoding.htm �U�别�Q�中�U?/p> 摘要�Q�本文介�l�了(ji��n)字符与编码的发展�q�程�Q�相��x(ch��ng)��늚�正确理解。�D例说明了(ji��n)一些实际应用中�Q�编码的实现�Ҏ(gu��)��。然后，本文讲述�?ji��n)通常对字�W�与�~�码的几�U�误解，�׃��q�些误解而导致�ؕ码��生的原因�Q�以�?qi��ng)消除�ؕ码的办法。本文的内容�늛��?#8220;中文问题”�Q?#8220;��q��问题”�?/p> 掌握�~�码问题的关键是正确地理解相��x(ch��ng)��念，�~�码所涉及(qi��ng)的技术其实是很简单的。因此，阅读本文旉��要慢��d��惻I��多思考�?/p> 引言 “字符与编�?#8221;是一个被�l�常讨论的话题。即使这��P��时常出现的�ؕ码仍然困扰着大家。虽然我们有很多的办法可以用来消除�ؕ 码，但我们�ƈ不一定理解这些办法的内在原理。而有的�ؕ码��生的原因�Q�实际上�׃��底层代码本��n有问题所��D��的。因此，不仅是初学者会(x��)对字�W�编码感到模�p�，�? 的底层开发�h员同样对字符�~�码�~�Z��准确的理解�?/p> 回页�?/a> 1. �~�码问题的由来，相关概念的理�?/h4> 1.1 字符与编码的发展从计��机对多国语�a�的支持角度看�Q�大致可以分��Z��个阶�D�：(x��) �pȝ��内码说明 �pȝ�� 阶段一 ASCII 计算机刚开始只支持��p��Q�其它语�a�不能够在计算��Z��存储和显�C��?/td> 英文 DOS 阶段�?/td> ANSI�~�码 �Q�本地化�Q?/td> ��Z��计算机支持更多语�a��Q�通常使用 0x80~0xFF 范围�?2 个字节来表示 1 个字�W�。比如：(x��)汉字 '�? 在中文操作系�l�中�Q��?[0xD6,0xD0] �q�两个字节存储�?br /> 不同的国家和地区制定�?ji��n)不同的标准�Q�由此��生了(ji��n) GB2312, BIG5, JIS �{�各自的�~�码标准。这些��?2 个字节来代表一个字�W�的各种汉字延�׾~�码方式�Q�称�?strong> ANSI �~�码。在��体中文系�l�下�Q�ANSI �~�码代表 GB2312 �~�码�Q�在日文操作�pȝ��下，ANSI �~�码代表 JIS �~�码�?br /> 不同 ANSI �~�码之间互不兼容�Q�当信息在国际间交流�Ӟ��无法��属于两�U�语�a�的文字，存储在同一�D?strong> ANSI �~�码的文本中�?/td> 中文 DOS�Q�中�?Windows 95/98�Q�日�?Windows 95/98 阶段�?/td> UNICODE �Q�国际化�Q?/td> ��Z��(ji��n)使国际间信息交流更加方便�Q�国际组�l�制定了(ji��n) UNICODE 字符�?/strong>�Q? 为各�U�语�a�中的每一个字�W�设定了(ji��n)�l�一�q�且唯一的数字编��P��以满��语言、跨�q�_��q�行文本转换、处理的要求�?/td> Windows NT/2000/XP�Q�Linux�Q�Java 字符串在内存?sh��)��的存放��?gu��)��Q?/p> �?ASCII 阶段�Q?strong>单字节字�W�串使用一个字节存放一个字�W�（SBCS�Q�。比如，"Bob123" 在内存�(sh��)��为：(x��) 42 6F 62 31 32 33 00 B o b 1 2 3 "0 在��?ANSI �~�码支持多种语言阶段�Q�每个字�W��用一个字节或多个字节来表�C�（MBCS�Q�，因此�Q�这�U�方式存攄��字符也被�U�C��多字节字�W?/strong>。比如，"中文 123" 在中�?Windows 95 内存?sh��)��?f��)7个字节，每个汉字�?个字节，每个英文和数字字�W�占1个字节：(x��) D6 D0 CE C4 31 32 33 00 �?/td> �?/td> 1 2 3 "0 �?UNICODE 被采用之后，计算机存攑֭��W�串�Ӟ��改�ؓ(f��)存放每个字符�?UNICODE 字符集中的序受��目前计��机一般��?2 个字节（16 位）(j��)来存放一个序��P��DBCS�Q�，因此�Q�这�U�方式存攄��字符也被�U�C��宽字节字�W?/strong>�? 比如�Q�字�W�串 "中文123" �?Windows 2000 下，内存?sh��)��实际存攄��?5 个序��P��(x��) 2D 4E 87 65 31 00 32 00 33 00 00 00 ← �?x86 CPU 中，低字节在�?/font> �?/td> �?/td> 1 2 3 "0 一共占 10 个字节�?/p> 回页�?/a> 1.2 字符�Q�字节，字符�?/h5> 理解�~�码的关键，是要把字�W�的概念和字节的概念理解准确。这两个概念�Ҏ(gu��)��h��Q�我们在此做一下区分：(x��) 概念描述举例字符 ��Z��使用的记��P��抽象意义上的一个符受��?/td> '1', '�?, 'a', '$', '�K?, …… 字节计算��Z��存储数据的单元，一�?位的二进制数�Q�是一个很具体的存储空间�?/td> 0x01, 0x45, 0xFA, …… ANSI 字符�?/td> 在内存�(sh��)��Q�如�?#8220;字符”是以 ANSI �~�码形式存在的，一个字�W? 可能使用一个字节或多个字节来表�C�，那么我们�U�这�U�字�W�串�?ANSI 字符�?/strong>或�?strong>多字节字�W�串�?/td> "中文123" �Q�占7字节�Q?/td> UNICODE 字符�?/td> 在内存�(sh��)��Q�如�?#8220;字符”是以�?UNICODE 中的序号存在的，那么我们�U�这�U�字�W�串�?UNICODE 字符�?/strong>或�?strong>宽字节字�W�串�?/td> L"中文123" �Q�占10字节�Q?/td> �׃��不同 ANSI �~�码所规定的标准是不相同的�Q�因此，对于一个给定的多字节字�W�串�Q�我们必��ȝ��道它采用的是哪一�U�编码规则，才能够知道它包含�?ji��n)哪�?#8220;字符”。而对�?UNICODE 字符�?/strong>来说�Q�不��在什么环境下�Q�它所代表�?#8220;字符”内容�? 是不变的�?/p> 回页�?/a> 1.3 字符集与�~�码各个国家和地区所制定的不�?ANSI �~�码标准中，都只规定�?ji��n)各自语�a�所需�?#8220;字符”。比如：(x��)汉字标准�Q�GB2312�Q�中没有规定韩国语字�W�怎样存储。这�?ANSI �~�码标准所规定的内容包含两层含义：(x��) 使用哪些字符。也��是说哪些汉字，字母和符号会(x��)被收入标准中。所包含“字符”的集合就叫做“字符�?/strong>”�? 规定每个“字符”分别用一个字节还是多个字节存储，用哪些字节来存储�Q�这个规定就叫做“�~�码”�? 各个国家和地区在制定�~�码标准的时候，“字符的集�?#8221;�?#8220;�~�码”一般都是同时制定的。因此，�q�_��我们所说的“字符�?#8221;�Q�比如：(x��)GB2312, GBK, JIS �{�，除了(ji��n)�?#8220;字符的集�?#8221;�q�层含义外，同时也包含了(ji��n)“�~�码”的含义�?/p> “UNICODE 字符�?/strong>”包含�?ji��n)各�U�语�a�中��用到的所�?#8220;字符”。用来给 UNICODE 字符集编码的标准有很多种�Q�比如：(x��)UTF-8, UTF-7, UTF-16, UnicodeLittle, UnicodeBig �{��?/p> 回页�?/a> 1.4 常用的编码简�?/h5> ��单介�l�一下常用的�~�码规则�Q��ؓ(f��)后边的章节做一个准备。在�q�里�Q�我们根据编码规则的特点�Q�把所有的�~�码分成三类�Q?/p> 分类 �~�码标准说明单字节字�W�编�?/td> ISO-8859-1 最��单的�~�码规则�Q�每一个字节直接作��Z��?UNICODE 字符。比如，[0xD6, 0xD0] �q�两个字节，通过 iso-8859-1 转化为字�W�串�Ӟ��直接得�?[0x00D6, 0x00D0] 两个 UNICODE 字符�Q�即 "ÖÐ"�?br /> 反之�Q�将 UNICODE 字符串通过 iso-8859-1 转化为字节串�Ӟ��只能正常转化 0~255 范围的字�W��?/td> ANSI �~�码 GB2312, BIG5, Shift_JIS, ISO-8859-2 …… �?UNICODE 字符串通过 ANSI �~�码转化�?#8220;字节�?#8221;�Ӟ��Ҏ(gu��)��各自�~�码的规定，一�?UNICODE 字符可能转化成一个字节或多个字节�?br /> 反之�Q�将字节串�{化成字符串时�Q�也可能多个字节转化成一个字�W�。比如，[0xD6, 0xD0] �q�两个字节，通过 GB2312 转化为字�W�串�Ӟ��得�?[0x4E2D] 一个字�W�，�?'�? 字�?br /> “ANSI �~�码”的特点：(x��) 1. �q�些“ANSI �~�码标准”都只能处理各自语�a�范围之内�?UNICODE 字符�?br /> 2. “UNICODE 字符”�?#8220;转换出来的字�?#8221;之间的关�p�L��Zؓ(f��)规定的�?/td> UNICODE �~�码 UTF-8, UTF-16, UnicodeBig …… �?#8220;ANSI �~�码”�c�M��的，把字�W�串通过 UNICODE �~�码转化�?#8220;字节�?#8221;�Ӟ��一�?UNICODE 字符可能转化成一个字节或多个字节�?br /> �?#8220;ANSI �~�码”不同的是�Q?br /> 1. �q�些“UNICODE �~�码”能够处理所有的 UNICODE 字符�?br /> 2. “UNICODE 字符”�?#8220;转换出来的字�?#8221;之间是可以通过计算得到的�?/td> 我们实际上没有必要去��q��每一�U�编码具体把某一个字�W�编码成�?ji��n)哪几个字节�Q�我们只需要知�?#8220;�~�码”的概念就是把“字符”�? 化成“字节”��可以了(ji��n)。对�?#8220;UNICODE �~�码”�Q�由于它们是可以通过计算得到的，因此�Q�在�Ҏ(gu��)��的场合，我们可以��M��(ji��n)解某一�U?#8220;UNICODE �~�码”是怎样的规则�?/p> 回页�?/a> 2. 字符与编码在�E�序中的实现 2.1 �E�序中的字符与字�?/h5> �?C++ �?Java 中，用来代表“字符”�?#8220;字节”的数据类型，以及(qi��ng)�q�行�~�码的方法：(x��) �c�d��或操�?/strong> C++ Java 字符 wchar_t char 字节 char byte ANSI 字符�?/td> char[] byte[] UNICODE 字符�?/td> wchar_t[] String 字节�?#8594;字符�?/td> mbstowcs(), MultiByteToWideChar() string = new String(bytes, "encoding") 字符�?#8594;字节�?/td> wcstombs(), WideCharToMultiByte() bytes = string.getBytes("encoding") 以上需要注意几点：(x��) Java 中的 char 代表一�?#8220;UNICODE 字符�Q�宽字节字符�Q?#8221;�Q��?C++ 中的 char 代表一个字节�?/li> MultiByteToWideChar() �?WideCharToMultiByte() �? Windows API 函数�?/li> 回页�?/a> 2.2 C++ 中相兛_��现方�?/h5> 声明一�D�字�W�串帔R��Q?/p> // ANSI 字符�Ԍ��内容长度 7 字节 char sz[20] = "中文123"; // UNICODE 字符�Ԍ��内容长度 5 �?wchar_t�Q?0 字节�Q?br /> wchar_t wsz[20] = L""x4E2D"x6587"x0031"x0032"x0033"; UNICODE 字符串的 I/O 操作�Q�字�W�与字节的�{换操作：(x��) // �q�行时设定当�?ANSI �~�码�Q�VC 格式 setlocale(LC_ALL, ".936"); // GCC 中格�?br /> setlocale(LC_ALL, "zh_CN.GBK"); // Visual C++ 中��用小�?%s�Q�按�?setlocale 指定�~�码输出到文�?br /> // GCC 中��用大�?%S fwprintf(fp, L"%s"n", wsz); // �?UNICODE 字符串按�?setlocale 指定的编码�{换成字节 wcstombs(sz, wsz, 20); // 把字节串按照 setlocale 指定的编码�{换成 UNICODE 字符�?br /> mbstowcs(wsz, sz, 20); �?Visual C++ 中，UNICODE 字符串常量有更简单的表示�Ҏ(gu��)��。如果源�E�序的编码与当前默认 ANSI �~�码不符�Q�则需要��?#pragma setlocale�Q�告诉编译器源程序��用的�~�码�Q?/p> // 如果源程序的�~�码与当前默�?ANSI �~�码不一��_(d��)�� // 则需要此行，�~�译时用来指明当前源�E�序使用的编�?/span> #pragma setlocale(".936") // UNICODE 字符串常量，内容长度 10 字节 wchar_t wsz[20] = L"中文123"; 以上需要注�?#pragma setlocale �?setlocale(LC_ALL, "") 的作用是不同的，#pragma setlocale 在编译时起作用，setlocale() 在运行时起作用�?/p> 回页�?/a> 2.3 Java 中相兛_��现方�?/h5> 字符串类 String 中的内容�?UNICODE 字符�Ԍ��(x��) // Java 代码�Q�直接写中文 String string = "中文123"; // 得到长度�?5�Q�因为是 5 个字�W?br /> System.out.println(string.length()); 字符�?I/O 操作�Q�字�W�与字节转换操作。在 Java �?java.io.* 中，�?#8220;Stream”�l�尾的类一般是用来操作“字节�?#8221;的类�Q�以“Reader”�Q?#8220;Writer”�l�尾的类一般是用来操作“字符�?#8221;的类�?/p> // 字符串与字节串间�怺�转化 // 按照 GB2312 得到字节�Q�得到多字节字符�Ԍ��(j��) byte [] bytes = string.getBytes("GB2312"); // 从字节按�?GB2312 得到 UNICODE 字符�?br /> string = new String(bytes, "GB2312"); // 要将 String 按照某种�~�码写入文本文�g�Q�有两种�Ҏ(gu��)��Q?br /> // �W�一�U�办法：(x��)�?Stream �c�d��入已�l�按照指定编码�{化好的字节串 OutputStream os = new FileOutputStream("1.txt"); os.write(bytes); os.close(); // �W�二�U�办法：(x��)构造指定编码的 Writer 来写入字�W�串 Writer ow = new OutputStreamWriter(new FileOutputStream("2.txt"), "GB2312"); ow.write(string); ow.close(); /* 最后得到的 1.txt �?2.txt 都是 7 个字�?*/ 如果 java 的源�E�序�~�码与当前默�?ANSI �~�码不符�Q�则在编译的时候，需要指明一下源�E�序的编码。比如：(x��) E:">javac -encoding BIG5 Hello.java 以上需要注意区分源�E�序的编码与 I/O 操作的编码，前者是在编译时起作用，后者是在运行时起作用�?/p> 回页�?/a> 3. 几种误解�Q�以�?qi��ng)�ؕ码��生的原因和解军_��?/h4> 3.1 �Ҏ(gu��)��产生的误�?/h5> 对编码的误解误解一在将“字节�?#8221;转化�?#8220;UNICODE 字符�?#8221;�Ӟ��比如在读取文本文件时�Q�或者通过�|�络传输文本�Ӟ��Ҏ(gu��)��?#8220;字节�?#8221;��单地作�ؓ(f��)单字节字�W�串�Q�采用每“一个字�?#8221;��是“一个字 �W?#8221;的方法进行�{化�?br /> 而实际上�Q�在非英文的环境中，应该��?#8220;字节�?#8221;作�ؓ(f��) ANSI 字符�Ԍ��采用适当的编码来得到 UNICODE 字符�Ԍ��有可�?#8220;多个字节”才能得到“一个字�W?#8221;�?br /> 通常�Q�一直在英文环境下做开发的�E�序员�(sh��)��Q�容易有�q�种误解�?/td> 误解�?/td> �?DOS�Q�W(xu��)indows 98 �{�非 UNICODE 环境下，字符串都是以 ANSI �~�码的字节�Ş式存在的。这�U�以字节形式存在的字�W�串�Q�必��ȝ��道是哪种�~�码才能被正��地使用。这使我们�Ş成了(ji��n)一个惯性思维�Q?#8220;字符串的�~�码”�?br /> �?UNICODE 被支持后�Q�Java 中的 String 是以字符�?#8220;序号”来存储的�Q�不是以“某种�~�码的字�?#8221;来存储的�Q�因此已�l�不存在“字符串的�~�码”�q�个概念�?ji��n)。只有在“字符�?#8221;�?#8220;字节�?#8221;转化�Ӟ��? 者，��一�?#8220;字节�?#8221;当成一�?ANSI 字符串时�Q�才有编码的概念�?br /> 不少的�h都有�q�个误解�?/td> �W�一�U�误解，往往是导致�ؕ码��生的原因。第二种误解�Q�往往��D��本来�Ҏ(gu��)��U�正的�ؕ码问题变得更复杂�?/p> 在这里，我们可以看到�Q�其中所讲的“误解一”�Q�即采用�?#8220;一个字�?#8221;��是“一个字�W?#8221;的�{化方法，实际上也��q��同于采用 iso-8859-1 �q�行转化。因此，我们常常使用 bytes = string.getBytes("iso-8859-1") 来进行逆向操作�Q�得到原始的“字节�?#8221;。然后再使用正确�?ANSI �~�码�Q�比�?string = new String(bytes, "GB2312")�Q�来得到正确�?#8220;UNICODE 字符�?#8221;�?/p> 回页�?/a> 3.2 �?UNICODE �E�序在不同语�a�环境间移植时的�ؕ�?/h5> �?UNICODE �E�序中的字符�Ԍ��都是以某�U?ANSI �~�码形式存在的。如果程序运行时的语�a�环境与开发时的语�a�环境不同�Q�将�?x��)导�?ANSI 字符串的昄��p�|�?/p> 比如�Q�在日文环境下开发的�?UNICODE 的日文程序界面，拿到中文环境下运行时�Q�界面上��显�C�Zؕ码。如果这个日文程序界面改为采�?UNICODE 来记录字�W�串�Q�那么当在中文环境下�q�行�Ӟ��界面上将可以昄��正常的日文�?/p> �׃��客观原因�Q�有时候我们必��d��中文操作�pȝ��下运行非 UNICODE 的日文��Y�Ӟ��q�时我们可以采用一些工��P��比如�Q�南极星�Q�AppLocale �{�，暂时的模拟不同的语言环境�?/p> 回页�?/a> 3.3 �|�页提交字符�?/h5> 当页面中的表单提交字�W�串�Ӟ��首先把字�W�串按照当前��面的编码，转化成字节串。然后再��每个字节�{化成 "%XX" 的格式提交到 Web 服务器。比如，一个编码�ؓ(f��) GB2312 的页面，提交 "�? �q�个字符串时�Q�提交给服务器的内容�?"%D6%D0"�?/p> 在服务器端，W(xu��)eb 服务器把收到�?"%D6%D0" 转化�?[0xD6, 0xD0] 两个字节�Q�然后再�Ҏ(gu��)�� GB2312 �~�码规则得到 "�? 字�?/p> �?Tomcat 服务器中�Q�request.getParameter() 得到��q��Ӟ��常常是因为前面提到的“误解一”造成的。默认情况下�Q�当提交 "%D6%D0" �l?Tomcat 服务器时�Q�request.getParameter() ��返�?[0x00D6, 0x00D0] 两个 UNICODE 字符�Q�而不是返回一�? "�? 字符。因此，我们需要��?bytes = string.getBytes("iso-8859-1") 得到原始的字节串�Q�再�? string = new String(bytes, "GB2312") 重新得到正确的字�W�串 "�?�?/p> 回页�?/a> 3.4 从数据库��d��字符�?/h5> 通过数据库客��L(f��ng)��Q�比�?ODBC �?JDBC�Q�从数据库服务器中读取字�W�串�Ӟ��客户端需要从服务器获知所使用�? ANSI �~�码。当数据库服务器发送字节流�l�客��L(f��ng)��Ӟ��客户端负责将字节��按照正��的�~�码转化�?UNICODE 字符丌Ӏ?/p> 如果从数据库��d��字符串时得到��q��Q�而数据库中存攄��数据又是正确的，那么往往�q�是因�ؓ(f��)前面提到�?#8220;误解一”造成的。解�? 的办法还是通过 string = new String( string.getBytes("iso-8859-1"), "GB2312") 的方法，重新得到原始的字节串�Q�再重新使用正确的编码�{化成字符丌Ӏ?/p> 回页�?/a> 3.5 �?sh��)子邮�g中的字符�?/h5> 当一�D?Text 或�?HTML 通过�?sh��)子邮�g传送时�Q�发送的内容首先通过一�U�指定的字符�~�码转化�?#8220;�? 节串”�Q�然后再�?#8220;字节�?#8221;通过一�U�指定的传输�~�码�Q�Content-Transfer-Encoding�Q�进行�{化得到另一�?#8220;字节 �?#8221;。比如，打开一��电(sh��)子邮件源代码�Q�可以看到类似的内容�Q?/p> Content-Type: text/plain; charset="gb2312" Content-Transfer-Encoding: base64 sbG+qcrQuqO17cf4yee74bGjz9W7+b3wudzA7dbQ0MQNCg0KvPKzxqO6uqO17cnnsaPW0NDEDQoNCg== 最常用�?Content-Transfer-Encoding �?Base64 �? Quoted-Printable 两种。在对二�q�制文�g或者中文文本进行�{化时�Q�Base64 得到�?#8220;字节�?#8221;�?Quoted-Printable 更短。在对英文文本进行�{化时�Q�Quoted-Printable 得到�?#8220;字节�?#8221;�?Base64 更短�?/p> 邮�g的标题，用了(ji��n)一�U�更��短的格式来标�?#8220;字符�~�码”�?#8220;传输�~�码”。比如，标题内容�? "�?�Q�则在邮件源代码中表�C�Zؓ(f��)�Q?/p> // 正确的标题格�?br /> Subject: =?GB2312?B?1tA=?= 其中�Q?/p> �W�一�?#8220;=?”�?#8220;?”中间的部分指定了(ji��n)字符�~�码�Q�在�q�个例子中指定的�?GB2312�?/li> “?”�?#8220;?”中间�?#8220;B”代表 Base64。如果是“Q”则代�?Quoted-Printable�?/li> 最�?#8220;?”�?#8220;?=”之间的部分，��是�l�过 GB2312 转化成字节串�Q�再�l�过 Base64 转化后的标题内容�?/li> 如果“传输�~�码”改�ؓ(f��) Quoted-Printable�Q�同��P��如果标题内容�?"�?�Q?/p> // 正确的标题格�?br /> Subject: =?GB2312?Q?=D6=D0?= 如果阅读邮�g时出��Cؕ码，一般是因�ؓ(f��)“字符�~�码”�?#8220;传输�~�码”指定有误�Q�或者是没有指定。比如，有的发邮件组件在发送邮件时�Q�标�?"�?�Q?/p> // 错误的标题格�?br /> Subject: =?ISO-8859-1?Q?=D6=D0?= �q�样的表�C�，实际上是明确指明�?ji��n)标题?sh��)ؓ(f��) [0x00D6, 0x00D0]�Q�即 "ÖÐ"�Q�而不�?"�?�?/p> 回页�?/a> 4. 几种错误理解的纠�?/h4> 误解�Q?#8220;ISO-8859-1 是国际编码？” 非也。iso-8859-1 只是单字节字�W�集中最��单的一�U�，也就�?#8220;字节�~�号”�?#8220;UNICODE 字符�~�号”一致的那种�~�码规则。当我们要把一�?#8220;字节�?#8221;转化�?#8220;字符�?#8221;�Q�而又不知道它是哪一�U?ANSI �~�码�Ӟ��先暂时地�?#8220;每一个字�?#8221;作�ؓ(f��)“一个字�W?#8221;�q�行转化�Q�不�?x��)造成信息丢失。然后再使用 bytes = string.getBytes("iso-8859-1") 的方法可恢复到原始的字节丌Ӏ?/p> 误解�Q?#8220;Java 中，怎样知道某个字符串的内码�Q?#8221; Java 中，字符串类 java.lang.String 处理的是 UNICODE 字符�Ԍ��不是 ANSI 字符丌Ӏ�我们只需要把字符串作�?#8220;抽象的符��L(f��ng)��?#8221;来看待。因此不存在字符串的内码的问题�?/p> ��菜毛毛 2010-04-30 11:15 发表评论交换两个变量的��|��不��用第三个变量 ��菜毛毛 — Wed, 02 Dec 2009 06:55:00 GMT 字体大小�Q?a onclick="changeFontSize(2);return false;" href="">�?/a>�?/strong>��?/a> 正文交换两个变量的��|��不��用第三个变量(2009-09-16 18:19:18) 标签�Q?a class="tag" target="_blank">杂谈分类�Q?a >计算�?/a> 通常我们的做法是�Q�尤其是在学�?f��n)阶�D�）(j��)�Q�定义一个新的变量，借助它完成交换。代码如下：(x��) int a,b; a=10; b=15; int t; t=a; a=b; b=t; �q�种��法易于理解�Q�特别适合帮助初学者了(ji��n)解计��机�E�序的特点，是赋��D��句的�l�典应用。在实际软�g开发当中，此算法简单明�?ji��n)，不�?x��)产生歧义�Q�便于程序员?sh��)��间的交��，一般情况下��到交换变量值的问题�Q�都应采用此��法�Q�以下称为标准算法）(j��)�?br /> 上面的算法最大的�~�点��是需要借助一个��(f��)时变量。那么不借助临时变量可以实现交换吗？�{�案是肯定的�Q�这里我们可以用三种��法来实玎ͼ�(x��)1�Q�算术运��；2�Q�指针地址操作�Q?�Q�位�q�算�?br /> 1�Q?��术�q�算 ��单来��_(d��)��是通过普通的+�?�q�算来实现。代码如下：(x��) int a,b; a=10;b=12; a=b-a; //a=2;b=12 b=b-a; //a=2;b=10 a=b+a; //a=10;b=10 通过以上�q�算�Q�a和b中的值就�q�行�?ji��n)交换。表面上看�v来很��单，但是不容易想刎ͼ��其是在�?f��n)惯标准��法之后�?br /> 它的原理是：(x��)把a、b看做数��u上的点，围绕两点间的距离来进行计��?br /> 具体�q�程�Q�第一�?#8220;a=b-a”求出ab两点的距��，�q�且��其保存在a中；�W�二�?#8220;b=b-a”求出a到原点的距离�Q�b到原点的距离与ab两点距离之差�Q�，�q�且��其保存在b中；�W�三�?#8220;a=b+a”求出b到原点的距离�Q�a到原点距��M��ab两点距离之和�Q�，�q�且��其保存在a中。完成交换�?br /> 此算法与标准��法相比�Q�多�?ji��n)三个计��的�q�程�Q�但是没有借助临时变量。（以下�U�Cؓ(f��)��术��法�Q?br /> 2�Q?指针地址操作因�ؓ(f��)对地址的操作实际上�q�行的是整数�q�算�Q�比如：(x��)两个地址相减得到一个整敎ͼ�表示两个变量在内存�(sh��)��的储存�(sh��)��|�隔�?ji��n)多��个字节�Q�地址和一个整数相加即“a+10”表示以a为基地址的在a�?0个a�c�L��据单元的地址。所以理��Z��可以通过和算术算法类似的�q�算来完成地址的交换，从而达��C��换变量的目的。即�Q?br /> int *a,*b; //假设 *a=new int(10); *b=new int(20); //&a=0x00001000h,&b=0x00001200h a=(int*)(b-a); //&a=0x00000200h,&b=0x00001200h b=(int*)(b-a); //&a=0x00000200h,&b=0x00001000h a=(int*)(b+int(a)); //&a=0x00001200h,&b=0x00001000h 通过以上�q�算a、b的地址真的已经完成�?ji��n)交换，且a指向�?ji��n)原先b指向的��|��b指向原先a指向的��g��(ji��n)吗？上面的代码可以通过�~�译�Q�但是执行结果却令�h匪夷所思！原因何在�Q?br /> 首先必须�?ji��n)解�Q�操作系�l�把内存分�ؓ(f��)几个区域�Q�系�l�代�?数据区、应用程序代�?数据区、堆栈区、全局数据区等�{�。在�~�译源程序时�Q�常量、全局变量�{�都攑օ�全局数据区，局部变量、动态变量则攑օ�堆栈区。这样当��法执行�?#8220;a=(int*)(b-a)”�Ӟ��a的值�ƈ不是0x00000200h�Q�而是要加上变量a所在内存区的基地址�Q�实际的�l�果是：(x��)0x008f0200h�Q�其�?x008f即�ؓ(f��)基地址�Q?200即�ؓ(f��)a在该内存区的位移。它是由�~�译器自动添加的。因此导致以后的地址计算均不正确�Q��得a,b指向所在区的其他内存单元。再�ơ，地址�q�算不能出现负数�Q�即当a的地址大于b的地址�Ӟ��b-a<0�Q�系�l�自动采用补码的形式表示负的位移�Q�由此会(x��)产生错误�Q�导致与前面同样的结果�?br /> 有办法解军_��Q�当�?d��ng)��以下是改�q�的��法�Q?br /> if(a { a=(int*)(b-a); b=(int*)(b-(int(a)&0x0000ffff)); a=(int*)(b+(int(a)&0x0000ffff)); } else { b=(int*)(a-b); a=(int*)(a-(int(b)&0x0000ffff)); b=(int*)(a+(int(b)&0x0000ffff)); } ��法做的最大改�q�就是采用位�q�算中的与运��?#8220;int(a)&0x0000ffff”�Q�因为地址中高16位�ؓ(f��)�D�地址�Q�后16位�ؓ(f��)位移地址�Q�将它和0x0000ffff�q�行与运��后�Q�段地址被屏蔽，只保留位�U�d��址。这样就原始��法��d��Q�从而得到正��的�l�果�?br /> 此算法同��h��有��用第三变量就完成�?ji��n)值的交换�Q�与��术��法比较它显得不好理解，但是它有它的优点卛_��交换很大的数据类型时�Q�它的执行速度比算术算法快。因为它交换的时地址�Q�而变量值在内存?sh��)��是没有�U�d��q�的。（以下�U�Cؓ(f��)地址��法�Q?br /> 3�Q?位运��?br /> 通过异或�q�算也能实现变量的交换，�q�也许是最为神奇的�Q�请看以下代码：(x��) int a=10,b=12; //a=1010^b=1100; a=a^b; //a=0110^b=1100; b=a^b; //a=0110^b=1010; a=a^b; //a=1100=12;b=1010; 此算法能够实现是由异或运��的特点军_��的，通过异或�q�算能够使数据中的某些位��{�Q�其他位不变。这��意味着��L��一个数与�Q意一个给定的��D��l�异或两�ơ，��g��变�?br /> 卻I��(x��)a^b^b=a。将a=a^b代入b=a^b则得b=a^b^b=a;同理可以得到a=b^a^a=b;��L��完成交换�?br /> 以上三个��法均实��C��(ji��n)不借助其他变量来完成两个变量值的交换�Q�相比较而言��术��法和位��法计算量相当，地址��法中计��较复杂�Q�却可以很轻杄��实现大类型（比如自定义的�c�L��l�构�Q�的交换�Q�而前两种只能�q�行整�Ş数据的交换（理论上重�?#8220;^”�q�算�W�，也可以实��C�Q意结构的交换�Q��?br /> 介绍�q�三�U�算法�ƈ不是要应用到实践当中�Q�而是��Z��(ji��n)探讨技术，展示�E�序设计的魅力。从中可以看出，数学中的��技巧对�E�序设计而言��h��相当的媄(ji��ng)响力�Q�运用得当会(x��)有意想不到的��奇效果。而从实际的��Y件开发看�Q�标准算法无疑是最好的�Q�能够解决�Q意类型的交换问题 ��菜毛毛 2009-12-02 14:55 发表评论 JAVA 书籍比较全的�|�站 http://ajava.org/book/ ��菜毛毛 — Wed, 02 Sep 2009 08:20:00 GMT JAVA 书籍比较全的�|�站 http://ajava.org/book/ ��菜毛毛 2009-09-02 16:20 发表评论主题�Q�多�U�程断点�l�传实践 ��菜毛毛 — Fri, 17 Jul 2009 14:12:00 GMT 摘要: �q�个�E�序的功能，��是可以分多个线�E�从目标地址上下载数据，每个�U�程负责下蝲一部分�Q��ƈ可以支持断点�l�传和超旉��q��? 下蝲的方法是download()�Q�它接收两个参数�Q�分别是要下载的��面的url和编码方式。在�q�个负责下蝲的方法中�Q�主要分�?ji��n)三个步骤。第一步是用来讄��断点�l�传时候的一些信息的�Q�第二步��是主要的分多线�E�来下蝲�?ji��n)，最后是数据的合�q��? 1、多�U�程下蝲�Q? Java代码... 阅读全文 ��菜毛毛 2009-07-17 22:12 发表评论

�pȝ��内码	说明	�pȝ��
阶段一	ASCII	计算机刚开始只支持��p��Q�其它语�a�不能够在计算��Z��存储和显�C��?/td>	英文 DOS
阶段�?/td>	ANSI�~�码 �Q�本地化�Q?/td>	��Z��计算机支持更多语�a��Q�通常使用 0x80~0xFF 范围�?2 个字节来表示 1 个字�W�。比如：(x��)汉字 '�? 在中文操作系�l�中�Q��?[0xD6,0xD0] �q�两个字节存储�?br /> 不同的国家和地区制定�?ji��n)不同的标准�Q�由此��生了(ji��n) GB2312, BIG5, JIS �{�各自的�~�码标准。这些��?2 个字节来代表一个字�W�的各种汉字延�׾~�码方式�Q�称�?strong> ANSI �~�码。在��体中文系�l�下�Q�ANSI �~�码代表 GB2312 �~�码�Q�在日文操作�pȝ��下，ANSI �~�码代表 JIS �~�码�?br /> 不同 ANSI �~�码之间互不兼容�Q�当信息在国际间交流�Ӟ��无法��属于两�U�语�a�的文字，存储在同一�D?strong> ANSI �~�码的文本中�?/td>	中文 DOS�Q�中�?Windows 95/98�Q�日�?Windows 95/98
阶段�?/td>	UNICODE �Q�国际化�Q?/td>	��Z��(ji��n)使国际间信息交流更加方便�Q�国际组�l�制定了(ji��n) UNICODE 字符�?/strong>�Q? 为各�U�语�a�中的每一个字�W�设定了(ji��n)�l�一�q�且唯一的数字编��P��以满��语言、跨�q�_��q�行文本转换、处理的要求�?/td>	Windows NT/2000/XP�Q�Linux�Q�Java

2D	4E	87	65	31	00	32	00	33	00	00	00	← �?x86 CPU 中，低字节在�?/font>

�?/td>		�?/td>		1		2		3		"0

概念描述	举例
字符	��Z��使用的记��P��抽象意义上的一个符受��?/td>	'1', '�?, 'a', '$', '�K?, ……
字节	计算��Z��存储数据的单元，一�?位的二进制数�Q�是一个很具体的存储空间�?/td>	0x01, 0x45, 0xFA, ……
ANSI 字符�?/td>	在内存�(sh��)��Q�如�?#8220;字符”是以 ANSI �~�码形式存在的，一个字�W? 可能使用一个字节或多个字节来表�C�，那么我们�U�这�U�字�W�串�?ANSI 字符�?/strong>或�?strong>多字节字�W�串�?/td>	"中文123" �Q�占7字节�Q?/td>
UNICODE 字符�?/td>	在内存�(sh��)��Q�如�?#8220;字符”是以�?UNICODE 中的序号存在的，那么我们�U�这�U�字�W�串�?UNICODE 字符�?/strong>或�?strong>宽字节字�W�串�?/td>	L"中文123" �Q�占10字节�Q?/td>

分类	�~�码标准	说明
单字节字�W�编�?/td>	ISO-8859-1	最��单的�~�码规则�Q�每一个字节直接作��Z��?UNICODE 字符。比如，[0xD6, 0xD0] �q�两个字节，通过 iso-8859-1 转化为字�W�串�Ӟ��直接得�?[0x00D6, 0x00D0] 两个 UNICODE 字符�Q�即 "ÖÐ"�?br /> 反之�Q�将 UNICODE 字符串通过 iso-8859-1 转化为字节串�Ӟ��只能正常转化 0~255 范围的字�W��?/td>
ANSI �~�码	GB2312, BIG5, Shift_JIS, ISO-8859-2 ……	�?UNICODE 字符串通过 ANSI �~�码转化�?#8220;字节�?#8221;�Ӟ��Ҏ(gu��)��各自�~�码的规定，一�?UNICODE 字符可能转化成一个字节或多个字节�?br /> 反之�Q�将字节串�{化成字符串时�Q�也可能多个字节转化成一个字�W�。比如，[0xD6, 0xD0] �q�两个字节，通过 GB2312 转化为字�W�串�Ӟ��得�?[0x4E2D] 一个字�W�，�?'�? 字�?br /> “ANSI �~�码”的特点：(x��) 1. �q�些“ANSI �~�码标准”都只能处理各自语�a�范围之内�?UNICODE 字符�?br /> 2. “UNICODE 字符”�?#8220;转换出来的字�?#8221;之间的关�p�L��Zؓ(f��)规定的�?/td>
UNICODE �~�码	UTF-8, UTF-16, UnicodeBig ……	�?#8220;ANSI �~�码”�c�M��的，把字�W�串通过 UNICODE �~�码转化�?#8220;字节�?#8221;�Ӟ��一�?UNICODE 字符可能转化成一个字节或多个字节�?br /> �?#8220;ANSI �~�码”不同的是�Q?br /> 1. �q�些“UNICODE �~�码”能够处理所有的 UNICODE 字符�?br /> 2. “UNICODE 字符”�?#8220;转换出来的字�?#8221;之间是可以通过计算得到的�?/td>

�c�d��或操�?/strong>	C++	Java
字符	wchar_t	char
字节	char	byte
ANSI 字符�?/td>	char[]	byte[]
UNICODE 字符�?/td>	wchar_t[]	String
字节�?#8594;字符�?/td>	mbstowcs(), MultiByteToWideChar()	string = new String(bytes, "encoding")
字符�?#8594;字节�?/td>	wcstombs(), WideCharToMultiByte()	bytes = string.getBytes("encoding")

对编码的误解
误解一	在将“字节�?#8221;转化�?#8220;UNICODE 字符�?#8221;�Ӟ��比如在读取文本文件时�Q�或者通过�\|�络传输文本�Ӟ��Ҏ(gu��)��?#8220;字节�?#8221;��单地作�ؓ(f��)单字节字�W�串�Q�采用每“一个字�?#8221;��是“一个字 �W?#8221;的方法进行�{化�?br /> 而实际上�Q�在非英文的环境中，应该��?#8220;字节�?#8221;作�ؓ(f��) ANSI 字符�Ԍ��采用适当的编码来得到 UNICODE 字符�Ԍ��有可�?#8220;多个字节”才能得到“一个字�W?#8221;�?br /> 通常�Q�一直在英文环境下做开发的�E�序员�(sh��)��Q�容易有�q�种误解�?/td>
误解�?/td>	�?DOS�Q�W(xu��)indows 98 �{�非 UNICODE 环境下，字符串都是以 ANSI �~�码的字节�Ş式存在的。这�U�以字节形式存在的字�W�串�Q�必��ȝ��道是哪种�~�码才能被正��地使用。这使我们�Ş成了(ji��n)一个惯性思维�Q?#8220;字符串的�~�码”�?br /> �?UNICODE 被支持后�Q�Java 中的 String 是以字符�?#8220;序号”来存储的�Q�不是以“某种�~�码的字�?#8221;来存储的�Q�因此已�l�不存在“字符串的�~�码”�q�个概念�?ji��n)。只有在“字符�?#8221;�?#8220;字节�?#8221;转化�Ӟ��? 者，��一�?#8220;字节�?#8221;当成一�?ANSI 字符串时�Q�才有编码的概念�?br /> 不少的�h都有�q�个误解�?/td>

一级片在线视频,自拍偷拍欧美视频,伊人久久大香线蕉综合网站

java sax 解析 实例

java反射详解

java中文汉字排序

�C�Z��文本�Q?/h4> String [] test = new String[] { "作业", "���试", "test", "我们", "。空", "镂空", "[", "��?, "�? };

jdk 版本�Q?/h4> 1.5.6

开发��^収ͼ�(x��)

关键字：(x��) 中文排序

概述

JAVAC 命��o(h��)详解(http://www.cnblogs.com/jeffchen/archive/2008/01/16/1041783.html)

�l�构

说明

查找�c�d��

文�g列表

选项

标准选项

联编选项

非标准选项

�E�序�C�Z��

���源文�g和类文�g分开

联编�E�序�C�Z��

字符�Q�字节和�~�码

字符�Q�字节和�~�码

引言

1. �~�码问题的由来，相关概念的理�?/h4>

1.1 字符与编码的发展

1.3 字符集与�~�码

2. 字符与编码在�E�序中的实现

3. 几种误解�Q�以�?qi��ng)�ؕ码��生的原因和解军_���?/h4>

4. 几种错误理解的纠�?/h4>

误解�Q?#8220;ISO-8859-1 是国际编码？”

误解�Q?#8220;Java 中，怎样知道某个字符串的内码�Q?#8221;

交换两个变量的��|��不��用第三个变量

JAVA 书籍比较全的�|�站 http://ajava.org/book/

主题�Q�多�U�程断点�l�传实践

java sax 解析实例

�C�Z��文本�Q?/h4>

String [] test = new String[] {
"作业",
"��试",
"test",
"我们",
"。空",
"镂空",
"[",
"��?,
"�?
};

jdk 版本�Q?/h4>
1.5.6

��源文�g和类文�g分开

`联编�E�序�C�Z��`

3. 几种误解�Q�以�?qi��ng)�ؕ码��生的原因和解军_��?/h4>