亚洲精品视频在线观看免费,国产精品久久久一区二区,久久久精品蜜桃

�~�写安全的Java代码

�Ҏ(gu��)��铸就辉煌 — Tue, 19 Dec 2006 01:29:00 GMT

radic 发表�?2006-12-15 12:24:05
作�?Radic 来源:sun
评论�?5 点击�?592 投票��d��?6 投票��M�h��?2
关键�?Java;安全�~�码

摘要:

本文是来自Sun官方站点的一��关于如何编写安全的Java代码的指�?开发者在�~�写一般代码时�Q�可以参照本文的指南

本文是来自Sun官方站点的一��关于如何编写安全的Java代码的指�?开发者在�~�写一般代码时�Q�可以参照本文的指南�Q?br />
•        静态字�D?br />•        羃?y��u)��作用�?br />•        公共方法和字段
•        保护包
•        equals�Ҏ(gu��)��
•        如果可能��对象不可改变
•        不要返回指向包含敏感数据的内部数组的引�?br />•        不要直接存储用��h��供的数组
•        序列化
•        原生函�?br />•        清除敏感信�?/span>

静态字�D?/b>
•        避免��用非final的公共静态变�?br />应尽可能地避免��用非final公共静态变量，因�ؓ无法判断代码有无权限改变�q�些变量倹{�?br />•        一般地�Q�应谨慎使用易变的静态状态，因�ؓ�q�可能导致设想中�怺�独立的子�pȝ��之间发生不可预知的交互�?br />
�~�小作用�?/b>
作�ؓ一个惯例，��可能羃?y��u)��方法和字段的作用域。检查包讉K��权限的成员能否改成私有的�Q�保护类型的成员可否�Ҏ(gu��)��包访问权限的或者私有的�Q�等�{��?br />
公共�Ҏ(gu��)��/字段
避免使用公共变量�Q�而是使用讉K��器方法访问这些变量。用�q�种方式�Q�如果需要，可能增加集中安全控制�?br />对于��M��公共�Ҏ(gu��)��Q�如果它们能够访问或修改��M��敏感内部状态，务必使它们包含安全控制�?br />参考如下代码段�Q�该代码�D�中不可信�Q代码可能讄��TimeZone的��|��
private static TimeZone  defaultZone = null;

      public static synchronized void setDefault(TimeZone zone)
      {
          defaultZone = zone;
      }

保护�?/b>
有时需要在全局防止包被不可信�Q代码讉K��Q�本节描�q�C��一些防护技术：
•        防止包注入�Q�如果不可信��M��码想要访问类的包保护成员�Q�可以尝试在被攻�ȝ��包内定义自己的新�cȝ��以获取这些成员的讉K��权。防止这�c�L��ȝ��方式有两�U�：
1.        通过向java.security.properties文�g中加入如下文字防止包内被注入恶意�c�R�?br />
          ...
package.definition=Package#1 [,Package#2,...,Package#n]

...

�q�会��D��当试囑֜�包内定义新类时类装蝲器的defineClass�Ҏ(gu��)��会抛出异常，除非赋予代码一下权限：
...
RuntimePermission("defineClassInPackage."+package)

...

2.        另一�U�方式是通过��包内的�c�d��入到��装的Jar文�g里�?br />�Q�参看http://java.sun.com/j2se/sdk/1.2/docs/guide/extensions/spec.html�Q?br />    通过使用�q�种技巧，代码无法获得扩展包的权限�Q�因此也无须修改java.security.properties文�g�?br />•        防止包讉K��Q�通过限制包访问�ƈ仅赋予特定代码访问权限防止不可信��M��码对包成员的讉K��。通过向java.security.properties文�g中加入如下文字可以达到这一目的�Q?br />
      ...
package.access=Package#1 [,Package#2,...,Package#n]

...

�q�会��D��当试囑֜�包内定义新类时类装蝲器的defineClass�Ҏ(gu��)��会抛出异常，除非赋予代码一下权限：
...
RuntimePermission("defineClassInPackage."+package)

...

如果可能使对象不可改�?/b>
如果可能�Q��对象不可改变。如果不可能�Q��得它们可以被克隆�q�返回一个副本。如果返回的对象是数�l�、向量或哈希表等�Q�牢记这些对象不能被改变�Q�调用者修改这些对象的内容可能��D��安全漏洞。此外，因�ؓ不用上锁�Q�不可改变性能够提高�ƈ发性。参考Clear sensitive information了解该惯例的例外情况�?br />
不要�q�回指向包含敏感数据的内部数�l�的引用
该惯例仅仅是不可变惯例的变型�Q�在�q�儿提出是因为常常在�q�里犯错。即使数�l�中包含不可变的对象�Q�如字符�Ԍ��Q�也要返回一个副本这栯��用者不能修�Ҏ(gu��)��l�中的字�W�串。不要传回一个数�l�，而是数组的拷贝�?br />
不要直接在用��h��供的数组里存�?/b>
该惯例仅仅是不可变惯例的另一个变型。��用对象数�l�的构造器和方法，比如说PubicKey数组�Q�应当在��数�l�存储到内部之前克隆数组�Q�而不是直接将数组引用赋给同样�c�d��的内部变量。缺��这个警惕，用户对外部数�l�做得�Q何变动（在��用讨��Z��的构造器创徏对象后）可能意外地更改对象的内部状态，即��该对象可能是无法改变�?br />
序列�?/b>
当对对象序列化时�Q�直到它被反序列化，它不在Java�q�行时环境的控制之下�Q�因此也不在Java�q�_��提供的安全控制范围内�?br />在实现Serializable时务必将以下事宜牢记在心�Q?br />•        transient

在包含系�l�资源的直接句柄和相对地址�I�间信息的字�D�前使用transient关键字�?如果资源�Q�如文�g句柄�Q�不被声明�ؓtransient�Q�该对象在序列化状态下可能会被修改�Q�从而��得被反序列化后获取对资源的不当访问�?br />
•        特定类的序列化/反序列化�Ҏ(gu��)��

��Z��保反序列化对象不包含违反一些不变量集合的状态，�c�d��该定义自��q��反序列化�Ҏ(gu��)��q��用ObjectInputValidation接口验证�q�些变量�?br />
如果一个类定义了自��q��序列化方法，它就不能向�Q何DataInput/DataOuput�Ҏ(gu��)��传递内部数�l�。所有的DataInput/DataOuput�Ҏ(gu��)��都能被重写。注意默认序列化不会向DataInput/DataOuput字节数组�Ҏ(gu��)��暴露�U�有字节数组字段�?br />
如果Serializable�cȝ��接向DataOutput(write(byte [] b))�Ҏ(gu��)��传递了一个私有数�l�，那么黑客可以创徏ObjectOutputStream的子�c�dƈ覆盖write(byte [] b)�Ҏ(gu��)��Q�这样他可以讉K��q�修改私有数�l�。下面示例说明了�q�个问题�?br />你的�c?
      public class YourClass implements Serializable {

            private byte [] internalArray;
....
private synchronized void writeObject(ObjectOutputStream stream) {
...

               stream.write(internalArray);
                ...
}
}

黑客代码

       public class HackerObjectOutputStream extends ObjectOutputStream{
            public void write (byte [] b) {
               Modify b
      }
}
...
             YourClass yc = new YourClass();
              ...

             HackerObjectOutputStream hoos = new HackerObjectOutputStream();

              hoos.writeObject(yc);

•        字节流加密

保护虚拟机外的字节流的另一方式是对序列化包产生的流�q�行加密。字节流加密防止解码或读取被序列化的对象的私有状态。如果决定加密，应该��理好密钥，密钥的存攑֜�点以及将密钥交付�l�反序列化程序的方式�{��?br />
•        需要提防的其他事宜

如果不可信�Q代码无法创徏对象�Q�务必确保不可信��M��码也不能反序列化对象。切记对对象反序列化是创建对象的另一途径�?br />比如��_��如果一个applet创徏了一个frame�Q�在该frame上创��Z��警告标签。如果该frame被另一应用�E�序序列化�ƈ被一个applet反序列化�Q�务必��该frame出现时带有同一个警告标�{��?br />
原生�Ҏ(gu��)��
应从以下几个斚w��查原生方法：
•        它们返回什�?br />•        它们需要什么参�?br />•        它们是否绕�q�了安全��?br />•        它们是否是公共的，�U�有的等
•        它们是否包含能�l�过包边界的�Ҏ(gu��)��调用�Q�从而绕�q�包保护

清除敏感信息
当保存敏感信息时�Q�如机密�Q�尽量保存在如数�l�这��L��可变数据�c�d��中，而不是保存在字符串这��L��不可变对象中�Q�这样��得敏感信息可以尽早显式地被清除。不要指望Java�q�_��的自动垃圑֛�收来做这�U�清除，因�ؓ回收器可能不会清除这�D�内存，或者很久后才会回收。尽早清除信息��得来自虚拟机外部的堆��查攻��d��得困难�?br />

�Ҏ(gu��)��铸就辉煌 2006-12-19 09:29 发表评论

有关MySQL的数据同步备份复刉��?

�Ҏ(gu��)��铸就辉煌 — Tue, 14 Nov 2006 03:29:00 GMT

MySQL�?.23.15版本以后提供数据库复制功能。利用该功能可以实现两个数据库同步，��M��模式�Q�互相备份模式的功能

数据库同步复制功能的讄��都在mysql的设�|�文件中体现。mysql的配�|�文�Ӟ��一般是my.cnf�Q�，在unix环境下在/etc/mysql/my.cnf 或者在mysql用户的home目录下的my.cnf�?

window环境中，如果c:根目录下有my.cnf文�g则取该配�|�文件。当�q�行mysql的winmysqladmin.exe工具时候，该工具会把c:根目录下的my.cnf 命名为mycnf.bak。�ƈ在winnt目录下创建my.ini。mysql服务器启动时候会读该配置文�g。所以可以把my.cnf中的内容拯��到my.ini文�g中，用my.ini文�g作�ؓmysql服务器的配置文�g�?

讄��Ҏ(gu��)��Q?

讄��范例环境�Q?

操作�pȝ��Q�window2000 professional

mysql�Q?.0.4-beta-max-nt-log

A ip:10.10.10.22

B ip:10.10.10.53

A:讄��

1.增加一个用��h��为同步的用户帐号�Q?

GRANT FILE ON *.* TO backup@'10.10.10.53' IDENTIFIED BY �?234�?/ccid_code>

2.增加一个数据库作�ؓ同步数据库：

create database backup

B:讄��

1.增加一个用��h��为同步的用户帐号�Q?

GRANT FILE ON *.* TO backup@'10.10.10.22' IDENTIFIED BY �?234�?/ccid_code>

2.增加一个数据库作�ؓ同步数据库：

create database backup

��M��模式�Q�A->B

A为master

修改A mysql的my.ini文�g。在mysqld配置��中加入下面配置�Q?

server-id=1log-bin#讄��需要记录log 可以讄��log-bin=c:mysqlbakmysqllog 讄��日志文�g的目录，#其中mysqllog是日志文件的名称�Q�mysql��徏立不同扩展名�Q�文件名为mysqllog的几个日志文件。binlog-do-db=backup #指定需要日志的数据�?

重�v数据库服务�?

用show master status 命��o看日志情��c�?

B为slave

修改B mysql的my.ini文�g。在mysqld配置��中加入下面配置�Q?

server-id=2master-host=10.10.10.22master-user=backup

#同步用户帐号

master-password=1234master-port=3306master-connect-retry=60

预设重试间隔60�U�replicate-do-db=backup 告诉slave只做backup数据库的更新

重�v数据�?

用show slave status看同步配�|�情��c�?

注意�Q�由于设�|�了slave的配�|�信息，mysql在数据库目录下生成master.info�Q�所以如有要修改相关slave的配�|�要先删除该文�g。否则修改的配置不能生效�?

双机互备模式�?

如果在A加入slave讄��Q�在B加入master讄��Q�则可以做B->A的同步�?

在A的配�|�文件中 mysqld 配置��加入以下设�|�：

master-host=10.10.10.53master-user=backupmaster-password=1234replicate-do-db= backupmaster-connect-retry=10

在B的配�|�文件中 mysqld 配置��加入以下设�|�：

log-bin=c:mysqllogmysqllogbinlog-do-db=backup

注意�Q�当有错误��生时*.err日志文�g。同步的�U�程退出，当纠正错误后要让同步机制�q�行工作�Q�运行slave start

重�vAB机器�Q�则可以实现双向的热备�?

��试�Q?

向B(t��i)扚w��插入大数据量表AA�Q?872000�Q�条�Q�A数据库每�U�钟可以更新2500条数据�?

�Ҏ(gu��)��铸就辉煌 2006-11-14 11:29 发表评论

�Ҏ(gu��)��铸就辉煌 — Sun, 12 Nov 2006 03:27:00 GMT
优化数据库的思想�Q?br /> ================
1、关键字�D�徏立烦引�?br /> 2、��用存储过�E�，它��SQL变得更加灉|��和高效�?br /> 3、备份数据库和清除垃圾数据�?br /> 4、SQL语句语法的优化。（可以用Sybase的SQL Expert�Q�可惜我没找到unexpired�?br />序列��P��
5、清理删除日志�?br />
SQL语句优化的原则：
==================
1、��用烦引来更快地遍历表�?br /> �~�省情况下徏立的索引是非��集索引�Q�但有时它�ƈ不是最佳的。在非群集烦引下�Q�数据在物理上随机存攑֜�数据��上。合理的索引设计要徏立在对各�U�查询的分析和预��上。一般来��_��
�?有大量重复倹{��且�l�常有范围查�?br /> �Q�between, > ,< �Q?gt; =,< =�Q�和order by、group by发生的列�Q�可考虑建立��集索引�Q?br /> �?�l�常同时存取多列�Q�且每列都含有重复值可考虑建立�l�合索引�Q?br /> �?�l�合索引要尽量��关键查询形成索引覆盖�Q�其前导列一定是使用最频繁的列。烦引虽有助于提高性能但不是烦引越多越好，恰好相反�q�多的烦引会��D��pȝ��低效。用户在表中每加�q�一个烦引，�l�护索引集合��p��做相应的更新工作�?br /> 2、IS NULL �?IS NOT NULL
不能用null作烦引，��M��包含null值的列都��不会被包含在烦引中。即使烦引有多列�q�样的情况下�Q�只要这些列中有一列含有null�Q�该列就会从索引中排除。也��是说如果某列存在空��|��即��对该列徏索引也不会提高性能。�Q何在where子句中��用is null或is not null的语句优化器是不允许使用索引的�?br /> 3、IN和EXISTS
EXISTS要远比IN的效率高。里面关�p�d��full table scan和range scan。几乎将所有的IN操作�W�子查询改写��Z��用EXISTS的子查询�?br /> 4、在��量查询时尽量少用格式�{换�?br /> 5、当在SQL SERVER 2000中，如果存储�q�程只有一个参敎ͼ��q�且是OUTPUT�c�d��的，必须在调用这个存储过�E�的时候给�q�个参数一个初始的��|��否则会出现调用错误�?br /> 6、ORDER BY和GROPU BY
使用ORDER BY和GROUP BY短语�Q��Q何一�U�烦引都有助于SELECT的性能提高。注意如果烦引列里面有NULL��|��Optimizer��无法优化�?br /> 7、�Q何对列的操作都将��D��表扫描，它包括数据库函数、计��表辑ּ��{�等�Q�查询时要尽可能��操作移至等号右辏V�?br /> 8、IN、OR子句�怼�使用工作表，使烦引失效。如果不产生大量重复��|��可以考虑把子句拆开。拆开的子句中应该包含索引�?br /> 9、SET SHOWPLAN_ALL ON 查看执行�Ҏ(gu��)��。DBCC��查数据库数据完整性�?br /> DBCC(DataBase Consistency Checker�Q�是一�l�用于验�?SQL Server 数据库完整性的�E�序�?br /> 10、慎用游�?br /> 在某些必��M��用游标的场合�Q�可考虑��符合条件的数据行�{入��时表中，再对临时表定义游标进行操作，�q�样可��性能得到明显提高�?br />
�ȝ��Q?br /> 所谓优化即WHERE子句利用了烦引，不可优化卛_��生了表扫描或额外开销。经验显�C�，SQL Server性能的最大改�q�得益于逻辑的数据库设计、烦引设计和查询设计斚w��。反�q�来��_��最大的性能问题常常是由其中�q�些相同斚w��中的不��引�v的。其实SQL优化的实质就是在�l�果正确的前提下�Q�用优化器可以识别的语句�Q�充份利用烦引，减少表扫描的I/O�ơ数�Q�尽量避免表搜烦的发生。其实SQL的性能优化是一个复杂的�q�程�Q�上�q�这些只是在应用层次的一�U�体玎ͼ�深入研究�q�会涉及数据库层的资源配�|�、网�l�层的流量控制以及操作系�l�层的��M��设计。�?br />

�Ҏ(gu��)��铸就辉煌 2006-11-12 11:27 发表评论

�Ҏ(gu��)��铸就辉煌 — Sat, 11 Nov 2006 01:59:00 GMT

��x��beanaction�?查到的资�?��Z��做个备䆾

多数IT �l�织都必��解决三个主要问题：1�Q�帮助组�l�减��成�?2�Q�增加�ƈ且保持客�?3�Q�加快业务效率。完成这些问题一般都需要实现对多个业务�pȝ��的数据和业务逻辑的无�~�访问，也就是说�Q�要实施�pȝ��集成工程�Q�以便联�l�业务流�E�、实现数据的讉K��与共享�?

JpetStore 4.0是ibatis的最新示例程序，��Z��Struts MVC框架�Q�注�Q�非传统Struts开发模式）�Q�以ibatis作�ؓ持久化层。该�C�Z��E�序设计优雅�Q�层�ơ清晎ͼ�可以学习以及作�ؓ一个高效率的编�E�模型参考。本文是在其基础上，采用Spring对其中间层（业务层）�q�行攚w��。��开发量�q�一步减��，同时又拥有了Spring的一些好处�?/p>
1. 前言
JpetStore 4.0是ibatis的最新示例程序。ibatis是开源的持久层��品，包含SQL Maps 2.0 �?Data Access Objects 2.0 框架。JpetStore�C�Z��E�序很好的展�C�Z��如何利用ibatis来开发一个典型的J2EE web应用�E�序。JpetStore有如下特点：

ibatis数据�?

POJO业务�?

POJO领域�c?

Struts MVC

JSP 表示�?

以下是本文用到的关键技术介�l�，本文假设�(zh��n)�已�l�对Struts�Q�SpringFramewok�Q�ibatis有一定的了解�Q�如果不是，请首先查阅附录中的参考资料�?/p>

Struts 是目前Java Web MVC框架中不争的王者。经�q�长达五�q�的发展�Q�Struts已经逐渐成长��Z��个稳定、成熟的框架�Q��ƈ且占有了MVC框架中最大的市场份额。但是Struts某些技术特性上已经落后于新兴的MVC框架。面对Spring MVC、Webwork2 �q�些设计更精密，扩展性更强的框架�Q�Struts受到了前所未有的挑战。但站在产品开发的角度而言�Q�Struts仍然是最�E�_��的选择。本文的原型例子JpetStore 4.0��是��Z��Struts开发的�Q�但是不拘惔于Struts的传�l�固定用法，例如只用了一个自定义Action�c�，�q�且在form bean�cȝ��定义上也是开创性的�Q��o��目一斎ͼ��E�后��具体剖析一下�?

Spring Framework 实际上是Expert One-on-One J2EE Design and Development 一书中所阐述的设计思想的具体实现。Spring Framework的功能非常多。包含AOP、ORM、DAO、Context、Web、MVC�{�几个部分组成。Web、MVC暂不用考虑�Q�JpetStore 4.0用的是更成熟的Struts和JSP�Q�DAO�׃��目前Hibernate、JDO、ibatis的流行，也不考虑�Q�JpetStore 4.0用的��是ibatis。因此最需要用的是AOP、ORM、Context。Context中，最重要的是Beanfactory�Q�它能将接口与实现分开�Q�非常强大。目前AOP应用最成熟的还是在事务��理上�?

ibatis 是一个功能强大实用的SQL Map工具�Q�不同于其他ORM工具�Q�如hibernate�Q�，它是��SQL语句映射成Java对象�Q�而对于ORM工具�Q�它的SQL语句是根据映��定义生成的。ibatis 以SQL开发的工作量和数据库移植性上的让步，为系�l�设计提供了更大的自��q��间。有ibatis代码生成的工��P��可以�Ҏ(gu��)��DDL自动生成ibatis代码�Q�能减少很多工作量�?

2. JpetStore��q?/strong>

2.1. 背景
最初是Sun公司的J2EE petstore�Q�其最主要目的是用于学习J2EE�Q�但是其�~�点也很明显�Q�就是过度设计了。接着Oracle用J2EE petstore来比较各应用服务器的性能。微软推��Z��Z��.Net�q�_��?Pet shop�Q�用于竞争J2EE petstore。而JpetStore则是�l�过改良的基于struts的轻便框架J2EE web应用�E�序�Q�相比来��_��JpetStore设计和架构更优良�Q�各层定义清晎ͼ�使用了很多最�?j��ng)_��践和模式�Q�避免了很多"反模�?�Q�如使用存储�q�程�Q�在java代码中嵌入SQL语句�Q�把HTML存储在数据库中等�{�。最新版本是JpetStore 4.0�?/p>
2.2. JpetStore开发运行环境的建立
1、开发环�?/p>

Java SDK 1.4.2

Apache Tomcat 4.1.31

Eclipse-SDK-3.0.1-win32

HSQLDB 1.7.2

2、Eclipse插�g

EMF SDK 2.0.1�Q�Eclipse建模框架�Q�lomboz插�g需要，可以使用runtime版本�?

lomboz 3.0�Q�J2EE插�g�Q�用来在Eclipse中开发J2EE应用�E�序

Spring IDE 1.0.3�Q�Spring Bean配置��理插�g

xmlbuddy_2.0.10�Q�编辑XML�Q�用免费版功能即�?

tomcatPluginV3�Q�tomcat��理插�g

Properties Editor�Q�编辑java的属性文�?�q�可以预览以及自动存盘�ؓUnicode格式。免��M��手工或者ANT调用native2ascii的麻烦�?

3、示例源�E�序

ibatis�C�Z��E�序JpetStore 4.0 http://www.ibatis.com/jpetstore/jpetstore.html

攚w��后的源�E�序�Q?spring�Q�（源码链接�Q?

2.3. 架构

�? JpetStore架构�?/b>

�? 是JPetStore架构图，更详�l�的内容请参见JPetStore的白皮书。参照这个架构图�Q�让我们�E�微剖析一下源代码�Q�得出JpetStore 4.0的具体实现图�Q�见�?�Q�，思�\一下子��p��然开朗了。前�a�中提到的非传�l�的struts开发模式，关键��在struts Action�c�d��form bean�c�M��?/p>
struts Action�c�d��有一个：BeanAction。没错，��实是一个！与传�l�的struts�~�程方式很不同。再仔细研究BeanAction�c�，发现它其实是一个通用�c�，利用反射原理�Q�根据URL来决定调用formbean的哪个方法。BeanAction大大��化了struts的编�E�模式，降低了对struts的依赖（与struts以及WEB容器有关的几个类都放在com.ibatis.struts包下�Q�其它的�c�都可以直接复用�Q�。利用这�U�模式，我们会很�Ҏ(gu��)��的把它移植到新的框架如JSF�Q�spring�?/p>
�q�样重心?y��u)��p�{�U�d��form bean上了�Q�它已经不是普通意义上的form bean了。查看源代码�Q�可以看到它不仅仅有数据和校�?重置�Ҏ(gu��)��Q�而且已经��h��了行为，从这个意义上来说�Q�它更像一个BO(Business Object)。这��是前文讲到的，BeanAction�c�d��用反��原理，�Ҏ(gu��)��URL来决定调用form bean的哪个方法（行�ؓ�Q�。form bean的这些方法的�{�֐�很简单，例如�Q?/p>

public String myActionMethod() { //..work return "success"; }

�Ҏ(gu��)��的返回值直接就是字�W�串�Q�对应的是forward的名�U�ͼ�而不再是ActionForward对象�Q�创建ActionForward对象的�Q务已�l�由BeanAction�c�M��劳了�?/p>
另外�Q�程序还提供了ActionContext工具�c�，该工��L��装了request 、response、form parameters、request attributes、session attributes�?application attributes中的数据存取操作�Q�简单而线�E�安全，form bean�c�M��用该工具�c�d��以进一步从表现层框架解耦�?/p>
在这里需要特别指出的是，BeanAction�c�L��对struts扩展的一个有益尝试，虽然提供了非常好的应用开发模式，但是它还非常斎ͼ�一直在发展中�?/p>
�? JpetStore 4.0具体实现

2.4. 代码剖析
下面��p��我们开始进一步分析JpetStore4.0的源代码�Q��ؓ下面的改造铺路�?/p>

BeanAction.java是唯一一个Struts action�c�，位于com.ibatis.struts包下。正如上文所�a��Q�它是一个通用的控制类�Q�利用反��机�Ӟ��把控制�{�U�d��form bean的某个方法来处理。详�l�处理过�E�参考其源代码，��单明晰�?

Form bean�c�M��于com.ibatis.jpetstore.presentation包下�Q�命名规则�ؓ***Bean。Form bean�c�d��部��承于BaseBean�c�，而BaseBean�c�d��际��承于ActionForm�Q�因此，Form bean�c�d��是Struts�?ActionForm�Q�Form bean�cȝ��属性数据就由struts框架自动填充。而实际上�Q�JpetStore4.0扩展了struts中ActionForm的应用： Form bean�c�还��h��行�ؓ�Q�更像一个BO,其行为（�Ҏ(gu��)��Q�由BeanAction�Ҏ(gu��)��配置�Q�struts-config.xml�Q�的URL来调用。虽然如此，我们�q�是把Form bean�c�d��位于表现层�?/p>
Struts-config.xml的配�|�里�?�U�映��方式，来告诉BeanAction把控制�{到哪个form bean对象的哪个方法来处理�?/p>
以这个请求连接�ؓ例http://localhost/jpetstore4/shop/viewOrder.do

1. URL Pattern

此种方式表示�Q�控制将被�{发到"orderBean"�q�个form bean对象 �?viewOrder"�Ҏ(gu��)��Q�行为）来处理。方法名�?path"参数的以"/"分隔的最后一部分�?/p>
2. Method Parameter

此种方式表示�Q�控制将被�{发到"orderBean"�q�个form bean对象�?viewOrder"�Ҏ(gu��)��Q�行为）来处理。配�|�中�?parameter"参数表示form bean�c�M��的方法�?parameter"参数优先�?path"参数�?/p>
3. No Method call

此种方式表示�Q�form bean上没有�Q何方法被调用。如果存�?name"属性，则struts把表单参数等数据填充到form bean对象后，把控制�{发到"success"。否则，如果name为空�Q�则直接转发控制�?success"�?/p>
�q�就相当于struts内置的org.apache.struts.actions.ForwardAction的功�?/p>

Service�c�M��于com.ibatis.jpetstore.service包下�Q�属于业务层。这些类��装了业务以及相应的事务控制。Service�cȝ��form bean�c�L��调用�?

com.ibatis.jpetstore.persistence.iface包下的类是DAO接口�Q�属于业务层�Q�其屏蔽了底层的数据库操作，供具体的Service�c�L��调用。DaoConfig�c�L��工具�c�（DAO工厂�c�）�Q�Service�c�通过DaoConfig�c�L��获得相应的DAO接口�Q�而不用关心底层的具体数据库操作，实现了如�?中{耦合2}的解耦�?

com.ibatis.jpetstore.persistence.sqlmapdao包下的类是对应DAO接口的具体实玎ͼ�在JpetStore4.0中采用了ibatis来实现ORM。这些实现类�l�承BaseSqlMapDao�c�，而BaseSqlMapDao�c�d��l�承ibatis DAO 框架中的SqlMapDaoTemplate�c�R��ibatis的配�|�文件存攑֜�com.ibatis.jpetstore.persistence.sqlmapdao.sql目录下。这些类和配�|�文件位于数据层

Domain�c�M��于com.ibatis.jpetstore.domain包下�Q�是普通的javabean。在�q�里用作数据传输对象�Q�DTO�Q�，贯穿视图层、业务层和数据层�Q�用于在不同层之间传输数据�?

剩下的部分就比较��单了�Q�请看具体的源代码，非常清晰�?/p>
2.5. 需要改造的地方
JpetStore4.0的关键就在struts Action�c�d��form bean�c�M��Q�这也是其精华之一�Q�虽然该实现方式是试验性，待扩充和验证�Q�，在此�ơ改造中我们要保留下来，��x��制层一点不变，表现层获取相应业务类的方式变了（要加载spring环境�Q�，其它保持不变。要特别��x��的改动是业务层和持久层，�q�运的是JpetStore4.0设计非常好，需要改动的地方非常��，而且由模式可循，如下�Q?/p>
1. 业务层和数据层用Spring BeanFactory机制��理�?/p>
2. 业务层的事务由spring 的aop通过声明来完成�?/p>
3. 表现层（form bean�Q�获取业务类的方法改��p��定义工厂�c�L��实现�Q�加载spring环境�Q��?/p>
3. JPetStore的改�?/strong>

3.1. 攚w��后的架�?/strong>

其中�U�色部分是要增加的部分，蓝色部分是要修改的部分。下面就让我们逐一剖析�?/p>
3.2. Spring Context的加�?/strong>
��Z��在Struts中加载Spring Context�Q�一般会在struts-config.xml的最后添加如下部分：

Spring在设计时��充分考虑��C��与Struts的协同工作，通过内置的Struts Plug-in在两者之间提供了良好的结合点。但是，因�ؓ在这里我们一点也不改动JPetStore的控制层(�q�是JpetStore4.0的精华之一)�Q�所以本文不准备采用此方式来加蝲ApplicationContext。我们利用的是spring framework 的BeanFactory机制,采用自定义的工具�c�（bean工厂�c�）来加载spring的配�|�文�Ӟ��从中可以看出Spring有多灉|��Q�它提供了各�U�不同的方式来��用其不同的部�?层次�Q��?zh��n)�只需要用你想用的�Q�不需要的部分可以不用�?/p>
具体的来��_��是在com.ibatis.spring包下创徏CustomBeanFactory�c�，spring的配�|�文件applicationContext.xml也放在这个目录下。以下就是该�cȝ��全部代码�Q�很��单：

public final class CustomBeanFactory { static XmlBeanFactory factory = null; static { Resource is = new InputStreamResource( CustomBeanFactory.class.getResourceAsStream("applicationContext.xml")); factory = new XmlBeanFactory(is); } public static Object getBean(String beanName){ return factory.getBean(beanName); } }

实际上就是封装了Spring 的XMLBeanFactory而已�Q��ƈ且Spring的配�|�文件只需要加载一�ơ，以后��可以直接用CustomBeanFactory.getBean("someBean")来获得需要的对象�?例如someBean)�Q�而不需要知道具体的�c�R��CustomBeanFactory�cȝ��于{耦合1}的解耦�?/p>
CustomBeanFactory�c�d��本文中只用于表现层的form bean对象获得service�cȝ��对象�Q�因为我们没有把form bean对象配置在applicationContext.xml中。但是，��Z��么不把表现层的form bean�c�M��配置��h��呢，�q�样��q��不着�q�CustomBeanFactory个类了，Spring会帮助我们创建需要的一切？问题的答案就在于form bean�c�L��struts的ActionForm�c�！如果大家熟�?zh��n)�struts�Q�就会知道ActionForm�c�L��struts自动创徏的：在一�ơ请求中�Q�struts判断�Q�如果ActionForm实例不存在，��创��Z��个ActionForm对象�Q�把客户提交的表单数据保存到ActionForm对象中。因此formbean�cȝ��对象��׃��能由spring来创建，但是service�c�M��及数据层的DAO�c�d��以，所以只有他们在spring中配�|��?/p>
所以，很自然的�Q�我们就创徏了CustomBeanFactory�c�，在表现层来衔接struts和spring。就�q�么��单，实现了另一�U�方式的{耦合一}的解耦�?/p>
3.3. 表现�?/strong>
�?面分析到�Q�struts和spring是在表现层衔接�v来的�Q�那么表现层��p��做稍微的更改�Q�即所需要的service�cȝ��对象创徏上。以表现层的AccountBean�c�Mؓ例：

原来的源代码如下

private static final AccountService accountService = AccountService.getInstance(); private static final CatalogService catalogService = CatalogService.getInstance();

攚w��后的源代码如下

private static final AccountService accountService = (AccountService)CustomBeanFactory.getBean("AccountService"); private static final CatalogService catalogService = (CatalogService)CustomBeanFactory.getBean("CatalogService");

其他的几个presentation�c�M��同样方式攚w��。这��P��表现层就完成了。关于表现层的其它部分如JSP�{�一概不动。也许�?zh��n)�会说�Q�没有看��Z��么特别之处的好处啊？你还是额外实��C��一个工厂类。别着急，帷幕刚刚开启，spring是在表现层引入，但�?zh��n)�发没发现�Q?/p>

presentation�c�M��仅面向service�cȝ��接口�~�程�Q�具�?AccountService"是哪个实现类�Q�presentation�c�M��知道�Q�是在spring的配�|�文仉��配置。（本例中，��Z��最大限度的保持原来的代码不作变化，没有抽象出接口）。Spring鼓励面向接口�~�程�Q�因为是如此的方便和自然�Q�当然�?zh��n)�也可以不�q�么做�?

CustomBeanFactory�q�个工厂�c�Mؓ什么会如此��单，因�ؓ其直接��用了Spring的BeanFactory。Spring从其核心而言�Q�是一个DI容器�Q�其设计哲学是提供一�U�无侵入式的高扩展性的框架。�ؓ了实现这个目标，Spring 大量引入了Java 的Reflection机制�Q�通过动态调用的方式避免��编码方式的�U�束�Q��ƈ在此基础上徏立了其核心组件BeanFactory�Q�以此作为其依赖注入机制的实现基��。org.springframework.beans包中包括了这些核心组件的实现�c�，核心中的核心为BeanWrapper和BeanFactory�c�R�?

3.4. 持久�?/strong>
在讨��Z��务层之前�Q�我们先看一下持久层�Q�如下图所�C�：

在上文中�Q�我们把iface包下的DAO接口归�ؓ业务层，在这里不需要做修改。ibatis的sql配置文�g也不需要改。要改的是DAO实现�c�，�q�在spring的配�|�文件中配置��h��?/p>
1、修改基�c?/p>
所有的DAO实现�c�都�l�承于BaseSqlMapDao�c�R��修改BaseSqlMapDao�c�d��下：

public class BaseSqlMapDao extends SqlMapClientDaoSupport { protected static final int PAGE_SIZE = 4; protected SqlMapClientTemplate smcTemplate = this.getSqlMapClientTemplate(); public BaseSqlMapDao() { } }

使BaseSqlMapDao�c�L��为��承于Spring提供的SqlMapClientDaoSupport�c�，�q�定义了一个保护属性smcTemplate�Q�其�c�d��为SqlMapClientTemplate。关于SqlMapClientTemplate�cȝ��详细说明请参照附录中�?Spring中文参考手�?

2、修改DAO实现�c?/p>
所有的DAO实现�c�还是��承于BaseSqlMapDao�c�，实现相应的DAO接口�Q�但其相应的DAO操作委托SqlMapClientTemplate来执行，以AccountSqlMapDao�c�Mؓ例，部分代码如下�Q?/p>

public List getUsernameList() { return smcTemplate.queryForList("getUsernameList", null); } public Account getAccount(String username, String password) { Account account = new Account(); account.setUsername(username); account.setPassword(password); return (Account) smcTemplate.queryForObject("getAccountByUsernameAndPassword", account); } public void insertAccount(Account account) { smcTemplate.update("insertAccount", account); smcTemplate.update("insertProfile", account); smcTemplate.update("insertSignon", account); }

��p��么简单，所有函数的�{�֐�都是一��L��Q�只需要查找替换就可以了！

3、除��d��厂类以及相应的配�|�文�?/p>
除去DaoConfig.java�q�个DAO工厂�c�d��相应的配�|�文件dao.xml�Q�因为DAO的获取现在要用spring来管理�?/p>
4、DAO在Spring中的配置�Q�applicationContext.xml�Q?/p>

org.hsqldb.jdbcDriver jdbc:hsqldb:hsql://localhost/xdb sa classpath:com\ibatis\jpetstore\persistence\sqlmapdao\sql\sql-map-config.xml

具体的语法请参照附录中的"Spring中文参考手�?。在�q�里只简单解释一下：

1. 我们首先创徏一个数据源dataSource�Q�在�q�里配置的是hsqldb数据库。如果是ORACLE数据库，driverClassName的值是"oracle.jdbc.driver.OracleDriver"�Q�URL的值类��g��"jdbc:oracle:thin:@wugfMobile:1521:cdcf"。数据源现在由spring来管理，那么现在我们��可以去掉properties目录下database.properties�q�个配置文�g了；�q�有不要忘记修改sql-map-config.xml�Q�去�?lt;properties resource="properties/database.properties"/>对它的引用�?/p>
2. sqlMapClient节点。这个是针对ibatis SqlMap的SqlMapClientFactoryBean配置。实际上配置了一个sqlMapClient的创建工厂类。configLocation属性配�|�了ibatis映射文�g的名�U�。dataSource属性指向了使用的数据源�Q�这��h��有��用sqlMapClient的DAO都默认��用了该数据源�Q�除非在DAO的配�|�中另外昑ּ�指定�?/p>
3. TransactionManager节点。定义了事务�Q��用的是DataSourceTransactionManager�?/p>
4. 下面��可以定义DAO节点了，如AccountDao�Q�它的实现类是com.ibatis.jpetstore.persistence.sqlmapdao.AccountSqlMapDao�Q��用的SQL配置从sqlMapClient中读取，数据库连接没有特别列出，那么��是默认使用sqlMapClient配置的数据源datasource�?/p>
�q�样�Q�我们就把持久层攚w��完了，其他的DAO配置�c�M��于AccountDao。怎么��P��单吧。这�ơ有接口了：�Q?AccountDao接口�Q?gt;AccountSqlMapDao实现�?/p>
3.5. 业务�?/strong>
业务层的位置以及相关�c�，如下图所�C�：

在这个例子中只有3个业务类�Q�我们以OrderService�c�Mؓ例来攚w��，�q�个�c�L��最复杂的，其中涉及了事务�?/p>
1、在ApplicationContext配置文�g中增加bean的配�|�：

PROPAGATION_REQUIRED

定义了一个OrderService�Q�还是很�Ҏ(gu��)��懂的。�ؓ了简单�v见，使用了嵌套bean�Q�其实现�c�L��com.ibatis.jpetstore.service.OrderService�Q�分别引用了ItemDao�Q�OrderDao�Q�SequenceDao。该bean的insert*实现了事务管�?AOP方式)。TransactionProxyFactoryBean自动创徏一个事务advisor�Q?该advisor包括一个基于事务属性的pointcut,因此只有事务性的�Ҏ(gu��)��被拦截�?/p>
2、业务类的修�?/p>
以OrderService��Z��Q?/p>

public class OrderService { /* Private Fields */ private ItemDao itemDao; private OrderDao orderDao; private SequenceDao sequenceDao; /* Constructors */ public OrderService() { } /** * @param itemDao 要设�|�的 itemDao�? */ public final void setItemDao(ItemDao itemDao) { this.itemDao = itemDao; } /** * @param orderDao 要设�|�的 orderDao�? */ public final void setOrderDao(OrderDao orderDao) { this.orderDao = orderDao; } /** * @param sequenceDao 要设�|�的 sequenceDao�? */ public final void setSequenceDao(SequenceDao sequenceDao) { this.sequenceDao = sequenceDao; } //剩下的部�? …�? }

�U�色部分��Z��攚w��分。Spring采用的是Type2的设�|�依赖注入，所以我们只需要定义属性和相应的设值函数就可以了，ItemDao�Q�OrderDao�Q�SequenceDao的值由spring在运行期间注入。构造函数就可以为空了，另外也不需要自��q��写代码处理事务了�Q�事务在配置中声明）�Q�daoManager.startTransaction();�{�与事务相关的语句也可以��L��了。和原来的代码比较一下，是不是处理精��了很多！可以更关注业务的实现�?/p>
4. �l�束�?/strong>
ibatis是一个功能强大实用的SQL Map工具�Q�可以直接控制SQL,为系�l�设计提供了更大的自��q��间。其提供的最新示例程序JpetStore 4.0,设计优雅�Q�应用了�q�今为止很多最�?j��ng)_��践和设计模式�Q�非帔R��于学习以及在此基础上创��量��的J2EE WEB应用�E�序。JpetStore 4.0是基于struts的，本文在此基础上，最大程度保持了原有设计的精华以及最��的代码改动量，在业务层和持久化层引入了Spring。在�(zh��n)�阅��M��本文以及攚w��后的源代码后，会深切的感受到Spring带来的种�U�好处：自然的面向接口的�~�程�Q�业务对象的依赖注入�Q�一致的数据存取框架和声明式的事务处理，�l�一的配�|�文件…更重要的是Spring既是全面的又是模块化的，Spring有分层的体系�l�构�Q�这意味着�(zh��n)�能选择仅仅使用它�Q何一个独立的部分�Q�就像本文，而它的架构又是内部一致�?/p>

�Ҏ(gu��)��铸就辉煌 2006-11-11 09:59 发表评论

�Ҏ(gu��)��铸就辉煌 — Tue, 24 Oct 2006 02:25:00 GMT

因了需要用到这些信�?所以�ȝ��一�?方便以后参阅
通过request.getHeader("User-Agent")大致可以取得用户��览器的信息
如果里面包含�Q?br />"msie"-->MicroSoft
"opera" -->Opera Software
"mozilla"-->Netscape Communications

如果取浏览器版本信息
String str = request.getHeader("User-Agent");
MS : str.substring(str.indexOf("msie") + 5);
Other :
tmpString = (str.substring(tmpPos = (str.indexOf("/")) + 1, tmpPos + str.indexOf(" "))).trim(); //没有亲自�?br />
操作�pȝ��部分,不啰嗦了
private void setOs()
{
if (this.userAgent.indexOf("win") > -1){
if (this.userAgent.indexOf("windows 95") > -1 || this.userAgent.indexOf("win95") > -1){
     this.os = "Windows 95";
}
if (this.userAgent.indexOf("windows 98") > -1 || this.userAgent.indexOf("win98") > -1){
     this.os = "Windows 98";
}
if (this.userAgent.indexOf("windows nt") > -1 || this.userAgent.indexOf("winnt") > -1){
      this.os = "Windows NT";
}
if (this.userAgent.indexOf("win16") > -1 || this.userAgent.indexOf("windows 3.") > -1){
      this.os = "Windows 3.x";
}
}
}

获取语言request.getHeader("Accept-Language");

详细信息可以再分�?...

�Ҏ(gu��)��铸就辉煌 2006-10-24 10:25 发表评论

�Ҏ(gu��)��铸就辉煌 — Tue, 17 Oct 2006 05:05:00 GMT

Lucene 是基�?Java 的全文信息检索包�Q�它目前�?Apache Jakarta 家族下面的一个开源项目。在�q�篇文章中，我们首先来看如何利用 Lucene 实现高��搜烦功能�Q�然后学习如何利�?Lucene 来创��Z��个健壮的 Web 搜烦应用�E�序�?/blockquote>
在本��文章中�Q�你会学习到如何利用 Lucene 实现高��搜烦功能以及如何利用 Lucene 来创�?Web 搜烦应用�E�序。通过�q�些学习�Q�你��可以利�?Lucene 来创��q��搜烦应用�E�序�?/p>
架构概览

通常一�?Web 搜烦引擎的架构分为前端和后端两部分，��像图一中所�C�。在前端��程中，用户在搜索引擎提供的界面中输入要搜烦的关键词�Q�这里提到的用户界面一般是一个带有输入框�?Web ��面�Q�然后应用程序将搜烦的关键词解析成搜索引擎可以理解的形式�Q��ƈ在烦引文件上�q�行搜烦操作。在排序后，搜烦引擎�q�回搜烦�l�果�l�用戗��在后端��程中，�|�络爬虫或者机器�h从因特网上获�?Web ��面�Q�然后烦引子�pȝ��解析�q�些 Web ��面�q�存入烦引文件中。如果你惛_��?Lucene 来创��Z��?Web 搜烦应用�E�序�Q�那么它的架构也和上面所描述的类��|��如图一中所�C��?/p>
Figure 1. Web 搜烦引擎架构

利用 Lucene 实现高��搜烦

Lucene 支持多种形式的高�U�搜索，我们在这一部分中会�q�行探讨�Q�然后我会��?Lucene �?API 来演�C�如何实现这些高�U�搜索功能�?/p>
布尔操作�W?/font>

大多数的搜烦引擎都会提供布尔操作�W�让用户可以�l�合查询�Q�典型的布尔操作�W�有 AND, OR, NOT。Lucene 支持 5 �U�布?y��u)��操作符�Q�分别是 AND, OR, NOT, �?+), �?-)。接下来我会讲述每个操作�W�的用法�?

OR: 如果你要搜烦含有字符 A 或�?B 的文��，那么��需要��?OR 操作�W�。需要记住的是，如果你只是简单的用空格将两个关键词分割开�Q�其实在搜烦的时候搜索引擎会自动在两个关键词之间加上 OR 操作�W�。例如，“Java OR Lucene�?�?“Java Lucene�?都是搜烦含有 Java 或者含�?Lucene 的文��?

AND: 如果你需要搜索包含一个以上关键词的文档，那么��需要��?AND 操作�W�。例如，“Java AND Lucene�?�q�回所有既包含 Java 又包�?Lucene 的文档�?

NOT: Not 操作�W��得包含紧跟在 NOT 后面的关键词的文��不会被�q�回。例如，如果你想搜烦所有含�?Java 但不含有 Lucene 的文档，你可以��用查询语�?“Java NOT Lucene”。但是你不能只对一个搜索词使用�q�个操作�W�，比如�Q�查询语�?“NOT Java�?不会�q�回��M��l�果�?

加号�Q?�Q?/b>: �q�个操作�W�的作用�?AND 差不多，但它只对紧跟着它的一个搜索词起作用。例如，如果你想搜烦一定包�?Java�Q�但不一定包�?Lucene 的文档，��可以��用查询语句�?Java Lucene”�?

减号�Q?�Q?/b>: �q�个操作�W�的功能�?NOT 一��P��查询语句 “Java -Lucene�?�q�回所有包�?Java 但不包含 Lucene 的文��?

接下来我们看一下如何利�?Lucene 提供�?API 来实现布?y��u)��查询�?a >清单1 昄��了如果利用布?y��u)��操作符�q�行查询的过�E��?/p>
清单1�Q��用布?y��u)��操作�?/b>

//Test boolean operator public void testOperator(String indexDirectory) throws Exception{ Directory dir = FSDirectory.getDirectory(indexDirectory,false); IndexSearcher indexSearcher = new IndexSearcher(dir); String[] searchWords = {"Java AND Lucene", "Java NOT Lucene", "Java OR Lucene", "+Java +Lucene", "+Java -Lucene"}; Analyzer language = new StandardAnalyzer(); Query query; for(int i = 0; i < searchWords.length; i++){ query = QueryParser.parse(searchWords[i], "title", language); Hits results = indexSearcher.search(query); System.out.println(results.length() + "search results for query " + searchWords[i]); } }

域搜�?Field Search)

Lucene 支持域搜索，你可以指定一�ơ查询是在哪些域(Field)上进行。例如，如果索引的文档包含两个域�Q?code>Title �?Content�Q�你��可以��用查�?“Title: Lucene AND Content: Java�?来返回所有在 Title 域上包含 Lucene �q�且�?Content 域上包含 Java 的文档�?a >清单 2 昄��了如何利�?Lucene �?API 来实现域搜烦�?

清单2�Q�实现域搜烦

//Test field search public void testFieldSearch(String indexDirectory) throws Exception{ Directory dir = FSDirectory.getDirectory(indexDirectory,false); IndexSearcher indexSearcher = new IndexSearcher(dir); String searchWords = "title:Lucene AND content:Java"; Analyzer language = new StandardAnalyzer(); Query query = QueryParser.parse(searchWords, "title", language); Hits results = indexSearcher.search(query); System.out.println(results.length() + "search results for query " + searchWords); }

通配�W�搜�?Wildcard Search)

Lucene 支持两种通配�W�：问号�Q�？�Q�和星号�Q?�Q�。你可以使用问号�Q�？�Q�来�q�行单字�W�的通配�W�查询，或者利用星��P��*�Q�进行多字符的通配�W�查询。例如，如果你想搜烦 tiny 或�?tony�Q�你��可以��用查询语�?“t?ny”；如果你想查询 Teach, Teacher �?Teaching�Q�你��可以��用查询语�?“Teach*”�?a >清单3 昄��了通配�W�查询的�q�程�?

清单3�Q�进行通配�W�查�?/b>

//Test wildcard search public void testWildcardSearch(String indexDirectory)throws Exception{ Directory dir = FSDirectory.getDirectory(indexDirectory,false); IndexSearcher indexSearcher = new IndexSearcher(dir); String[] searchWords = {"tex*", "tex?", "?ex*"}; Query query; for(int i = 0; i < searchWords.length; i++){ query = new WildcardQuery(new Term("title",searchWords[i])); Hits results = indexSearcher.search(query); System.out.println(results.length() + "search results for query " + searchWords[i]); } }

模糊查询

Lucene 提供的模�p�查询基于编辑距��ȝ��?Edit distance algorithm)。你可以在搜索词的尾部加上字�W?~ 来进行模�p�查询。例如，查询语句 “think~�?�q�回所有包含和 think �c�M��的关键词的文��?a >清单 4 昄��了如果利�?Lucene �?API �q�行模糊查询的代码�?

清单4�Q�实现模�p�查�?/b>

//Test fuzzy search public void testFuzzySearch(String indexDirectory)throws Exception{ Directory dir = FSDirectory.getDirectory(indexDirectory,false); IndexSearcher indexSearcher = new IndexSearcher(dir); String[] searchWords = {"text", "funny"}; Query query; for(int i = 0; i < searchWords.length; i++){ query = new FuzzyQuery(new Term("title",searchWords[i])); Hits results = indexSearcher.search(query); System.out.println(results.length() + "search results for query " + searchWords[i]); } }

范围搜烦(Range Search)

范围搜烦匚w��某个域上的值在一定范围的文��。例如，查询 “age:[18 TO 35]�?�q�回所�?age 域上的值在 18 �?35 之间的文��?a >清单5昄��了利�?Lucene �?API �q�行�q�回搜烦的过�E��?

清单5�Q�测试范围搜�?/b>

//Test range search public void testRangeSearch(String indexDirectory)throws Exception{ Directory dir = FSDirectory.getDirectory(indexDirectory,false); IndexSearcher indexSearcher = new IndexSearcher(dir); Term begin = new Term("birthDay","20000101"); Term end = new Term("birthDay","20060606"); Query query = new RangeQuery(begin,end,true); Hits results = indexSearcher.search(query); System.out.println(results.length() + "search results is returned"); }

回页�?/font>

�?Web 应用�E�序中集�?Lucene

接下来我们开发一�?Web 应用�E�序利用 Lucene 来检索存攑֜�文�g服务器上�?HTML 文��。在开始之前，需要准备如下环境：

Eclipse 集成开发环�?

Tomcat 5.0

Lucene Library

JDK 1.5

�q�个例子使用 Eclipse �q�行 Web 应用�E�序的开发，最�l�这�?Web 应用�E�序跑在 Tomcat 5.0 上面。在准备好开发所必需的环境之后，我们接下来进�?Web 应用�E�序的开发�?

1、创��Z��个动�?Web ��目

�?Eclipse 里面�Q�选择 File > New > Project�Q�然后再弹出的窗口中选择动�?Web ��目�Q�如图二所�C��?

图二�Q�创建动态Web��目

在创建好动�?Web ��目之后�Q�你会看到创建好的项目的�l�构�Q�如图三所�C�，��目的名�U�Cؓ sample.dw.paper.lucene�?

图三�Q�动�?Web ��目的结�?/b>

2. 设计 Web ��目的架�?/font>

在我们的设计中，把该�pȝ��分成如下四个子系�l�：

用户接口: �q�个子系�l�提供用��L��面��用户可以�?Web 应用�E�序服务器提交搜索请求，然后搜烦�l�果通过用户接口来显�C�出来。我们用一个名�?search.jsp 的页面来实现该子�pȝ��?

��h��理�?/b>: �q�个子系�l�管理从客户端发送过来的搜烦��h��q�把搜烦��h��分发到搜索子�pȝ��中。最后搜索结果从搜烦子系�l�返回�ƈ最�l�发送到用户接口子系�l�。我们��用一�?Servlet 来实现这个子�pȝ��?

搜烦子系�l?/b>: �q�个子系�l�负责在索引文�g上进行搜索�ƈ把搜索结构传递给��h��理器。我们��?Lucene 提供�?API 来实现该子系�l��?

索引子系�l?/b>: �q�个子系�l�用来�ؓ HTML ��面来创建烦引。我们��?Lucene �?API 以及 Lucene 提供的一�?HTML 解析器来创徏该子�pȝ��?

�? 昄��了我们设计的详细信息�Q�我们将用户接口子系�l�放�?webContent 目录下面。你会看��C��个名�?search.jsp 的页面在�q�个文�g多w��面。请求管理子�pȝ��在包 sample.dw.paper.lucene.servlet 下面�Q�类 SearchController 负责功能的实现。搜索子�pȝ��攑֜��?sample.dw.paper.lucene.search 当中�Q�它包含了两个类�Q?code>SearchManager �?SearchResultBean�Q�第一个类用来实现搜烦功能�Q�第二个�cȝ��来描�q�搜索结果的�l�构。烦引子�pȝ��攑֜��?sample.dw.paper.lucene.index 当中。类 IndexManager 负责�?HTML 文�g创徏索引。该子系�l�利用包 sample.dw.paper.lucene.util 里面的类 HTMLDocParser 提供的方�?getTitle �?getContent 来对 HTML ��面�q�行解析�?

囑֛��Q�项目的架构设计

3. 子系�l�的实现

在分析了�pȝ��的架构设计之后，我们接下来看�pȝ��实现的详�l�信息�?

用户接口: �q�个子系�l�有一个名�?search.jsp �?JSP 文�g来实玎ͼ��q�个 JSP ��面包含两个部分。第一部分提供了一个用��h��口去�?Web 应用�E�序服务器提交搜索请求，�?a >�?所�C�。注意到�q�里的搜索请求发送到了一个名�?SearchController �?Servlet 上面。Servlet 的名字和具体实现的类的对应关�p�d�� web.xml 里面指定�?

�?�Q�向Web服务器提交搜索请�?/b>

�q�个JSP的第二部分负责显�C�搜索结果给用户�Q�如�?所�C�：

�?�Q�显�C�搜索结�?/b>

��h��理�?/b>: 一个名�?SearchController �?servlet 用来实现该子�pȝ��?a >清单�Q?/font>�l�出了这个类的源代码�?

清单�Q�：��h��理器的实现

package sample.dw.paper.lucene.servlet; import java.io.IOException; import java.util.List; import javax.servlet.RequestDispatcher; import javax.servlet.ServletException; import javax.servlet.http.HttpServlet; import javax.servlet.http.HttpServletRequest; import javax.servlet.http.HttpServletResponse; import sample.dw.paper.lucene.search.SearchManager; /** * This servlet is used to deal with the search request * and return the search results to the client */ public class SearchController extends HttpServlet{ private static final long serialVersionUID = 1L; public void doPost(HttpServletRequest request, HttpServletResponse response) throws IOException, ServletException{ String searchWord = request.getParameter("searchWord"); SearchManager searchManager = new SearchManager(searchWord); List searchResult = null; searchResult = searchManager.search(); RequestDispatcher dispatcher = request.getRequestDispatcher("search.jsp"); request.setAttribute("searchResult",searchResult); dispatcher.forward(request, response); } public void doGet(HttpServletRequest request, HttpServletResponse response) throws IOException, ServletException{ doPost(request, response); } }

�?a >清单6中，doPost �Ҏ(gu��)��从客��L��获取搜烦词�ƈ创徏�c?SearchManager 的一个实例，其中�c?SearchManager 在搜索子�pȝ��中进行了定义。然后，SearchManager 的方�?search 会被调用。最后搜索结果被�q�回到客��L��?

搜烦子系�l?/b>: 在这个子�pȝ��中，我们定义了两个类�Q?code>SearchManager �?SearchResultBean。第一个类用来实现搜烦功能�Q�第二个�c�L��个JavaBean�Q�用来描�q�搜索结果的�l�构�?a >清单7�l�出了类 SearchManager 的源代码�?

清单7�Q�搜索功能的实现

package sample.dw.paper.lucene.search; import java.io.IOException; import java.util.ArrayList; import java.util.List; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.queryParser.ParseException; import org.apache.lucene.queryParser.QueryParser; import org.apache.lucene.search.Hits; import org.apache.lucene.search.IndexSearcher; import org.apache.lucene.search.Query; import sample.dw.paper.lucene.index.IndexManager; /** * This class is used to search the * Lucene index and return search results */ public class SearchManager { private String searchWord; private IndexManager indexManager; private Analyzer analyzer; public SearchManager(String searchWord){ this.searchWord = searchWord; this.indexManager = new IndexManager(); this.analyzer = new StandardAnalyzer(); } /** * do search */ public List search(){ List searchResult = new ArrayList(); if(false == indexManager.ifIndexExist()){ try { if(false == indexManager.createIndex()){ return searchResult; } } catch (IOException e) { e.printStackTrace(); return searchResult; } } IndexSearcher indexSearcher = null; try{ indexSearcher = new IndexSearcher(indexManager.getIndexDir()); }catch(IOException ioe){ ioe.printStackTrace(); } QueryParser queryParser = new QueryParser("content",analyzer); Query query = null; try { query = queryParser.parse(searchWord); } catch (ParseException e) { e.printStackTrace(); } if(null != query >> null != indexSearcher){ try { Hits hits = indexSearcher.search(query); for(int i = 0; i < hits.length(); i ++){ SearchResultBean resultBean = new SearchResultBean(); resultBean.setHtmlPath(hits.doc(i).get("path")); resultBean.setHtmlTitle(hits.doc(i).get("title")); searchResult.add(resultBean); } } catch (IOException e) { e.printStackTrace(); } } return searchResult; } }

�?a >清单7中，注意到在�q�个�c�里面有三个�U�有属性。第一个是 searchWord�Q�代表了来自客户端的搜烦词。第二个�?indexManager�Q�代表了在烦引子�pȝ��中定义的�c?IndexManager 的一个实例。第三个�?analyzer�Q�代表了用来解析搜烦词的解析器。现在我们把注意力放在方�?search 上面。这个方法首先检查烦引文件是否已�l�存在，如果已经存在�Q�那么就在已�l�存在的索引上进行检索，如果不存在，那么首先调用�c?IndexManager 提供的方法来创徏索引�Q�然后在新创建的索引上进行检索。搜索结果返回后�Q�这个方法从搜烦�l�果中提取出需要的属性�ƈ为每个搜索结果生成类 SearchResultBean 的一个实例。最后这�?SearchResultBean 的实例被攑ֈ�一个列表里面�ƈ�q�回�l�请求管理器�?/p>
在类 SearchResultBean 中，含有两个属性，分别�?htmlPath �?htmlTitle�Q�以及这个两个属性的 get �?set �Ҏ(gu��)��。这也意味着我们的搜索结果包含两个属性：htmlPath �?htmlTitle�Q�其�?htmlPath 代表�?HTML 文�g的�\径，htmlTitle 代表�?HTML 文�g的标题�?

索引子系�l?/b>: �c?IndexManager 用来实现�q�个子系�l��?a >清单8 �l�出了这个类的源代码�?

清单8�Q�烦引子�pȝ��的实�?/b>

package sample.dw.paper.lucene.index; import java.io.File; import java.io.IOException; import java.io.Reader; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.store.Directory; import org.apache.lucene.store.FSDirectory; import sample.dw.paper.lucene.util.HTMLDocParser; /** * This class is used to create an index for HTML files * */ public class IndexManager { //the directory that stores HTML files private final String dataDir = "c:\\dataDir"; //the directory that is used to store a Lucene index private final String indexDir = "c:\\indexDir"; /** * create index */ public boolean createIndex() throws IOException{ if(true == ifIndexExist()){ return true; } File dir = new File(dataDir); if(!dir.exists()){ return false; } File[] htmls = dir.listFiles(); Directory fsDirectory = FSDirectory.getDirectory(indexDir, true); Analyzer analyzer = new StandardAnalyzer(); IndexWriter indexWriter = new IndexWriter(fsDirectory, analyzer, true); for(int i = 0; i < htmls.length; i++){ String htmlPath = htmls[i].getAbsolutePath(); if(htmlPath.endsWith(".html") || htmlPath.endsWith(".htm")){ addDocument(htmlPath, indexWriter); } } indexWriter.optimize(); indexWriter.close(); return true; } /** * Add one document to the Lucene index */ public void addDocument(String htmlPath, IndexWriter indexWriter){ HTMLDocParser htmlParser = new HTMLDocParser(htmlPath); String path = htmlParser.getPath(); String title = htmlParser.getTitle(); Reader content = htmlParser.getContent(); Document document = new Document(); document.add(new Field("path",path,Field.Store.YES,Field.Index.NO)); document.add(new Field("title",title,Field.Store.YES,Field.Index.TOKENIZED)); document.add(new Field("content",content)); try { indexWriter.addDocument(document); } catch (IOException e) { e.printStackTrace(); } } /** * judge if the index exists already */ public boolean ifIndexExist(){ File directory = new File(indexDir); if(0 < directory.listFiles().length){ return true; }else{ return false; } } public String getDataDir(){ return this.dataDir; } public String getIndexDir(){ return this.indexDir; } }

�q�个�c�d��含两个私有属性，分别�?dataDir �?indexDir�?code>dataDir 代表存放�{�待�q�行索引�?HTML ��面的�\径，indexDir 代表了存�?Lucene 索引文�g的�\径。类 IndexManager 提供了三个方法，分别�?createIndex, addDocument �?ifIndexExist。如果烦引不存在的话�Q�你可以使用�Ҏ(gu��)�� createIndex ��d��Z��个新的烦引，用方�?addDocument ��d��一个烦引上��d��文��。在我们的场景中�Q�一个文��就是一�?HTML ��面。方�?addDocument 会调用由�c?HTMLDocParser 提供的方法对 HTML 文��q�行解析。你可以使用最后一个方�?ifIndexExist 来判�?Lucene 的烦引是否已�l�存在�?

现在我们来看一下放在包 sample.dw.paper.lucene.util 里面的类 HTMLDocParser。这个类用来�?HTML 文�g中提取出文本信息。这个类包含三个�Ҏ(gu��)��Q�分别是 getContent�Q?code>getTitle �?getPath。第一个方法返回去除了 HTML 标记的文本内容，�W�二个方法返�?HTML 文�g的标题，最后一个方法返�?HTML 文�g的�\径�?a >清单9 �l�出了这个类的源代码�?

清单9�Q�HTML 解析�?/b>

package sample.dw.paper.lucene.util; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; import java.io.Reader; import java.io.UnsupportedEncodingException; import org.apache.lucene.demo.html.HTMLParser; public class HTMLDocParser { private String htmlPath; private HTMLParser htmlParser; public HTMLDocParser(String htmlPath){ this.htmlPath = htmlPath; initHtmlParser(); } private void initHtmlParser(){ InputStream inputStream = null; try { inputStream = new FileInputStream(htmlPath); } catch (FileNotFoundException e) { e.printStackTrace(); } if(null != inputStream){ try { htmlParser = new HTMLParser(new InputStreamReader(inputStream, "utf-8")); } catch (UnsupportedEncodingException e) { e.printStackTrace(); } } } public String getTitle(){ if(null != htmlParser){ try { return htmlParser.getTitle(); } catch (IOException e) { e.printStackTrace(); } catch (InterruptedException e) { e.printStackTrace(); } } return ""; } public Reader getContent(){ if(null != htmlParser){ try { return htmlParser.getReader(); } catch (IOException e) { e.printStackTrace(); } } return null; } public String getPath(){ return this.htmlPath; } }

5�Q�在 Tomcat 5.0 上运行应用程�?/font>

现在我们可以�?Tomcat 5.0 上运行开发好的应用程序�?

右键单击 search.jsp�Q�然后选择 Run as > Run on Server�Q�如�?所�C��?

�?�Q�配�|?Tomcat 5.0

在弹出的�H�口中，选择 Tomcat v5.0 Server 作�ؓ目标 Web 应用�E�序服务器，然后点击 Next�Q�如�? 所�C�：

�?�Q�选择 Tomcat 5.0

现在需要指定用来运�?Web 应用�E�序�?Apache Tomcat 5.0 以及 JRE 的�\径。这里你所选择�?JRE 的版本必��d��你用来编�?Java 文�g�?JRE 的版本一致。配�|�好之后�Q�点�?Finish。如 �? 所�C��?

�?�Q�完成Tomcat 5.0的配�|?/b>

配置好之后，Tomcat 会自动运行，�q�且会对 search.jsp �q�行�~�译�q�显�C�给用户。如 �?0 所�C��?

�?0�Q�用��L��?/b>

在输入框中输入关键词 “information�?然后单击 Search 按钮。然后这个页面上会显�C�出搜烦�l�果来，�?�?1 所�C��?

�?1�Q�搜索结�?/b>

单击搜烦�l�果的第一个链接，��面上就会显�C�出所链接到的��面的内宏V��如 �?2 所�C?

�?2�Q�详�l�信�?/b>

现在我们已经成功的完成了�C�Z��目的开发，�q�成功的用Lucene实现了搜索和索引功能。你可以下蝲�q�个��目的源代码�Q?a >下蝲�Q��?

回页�?/font>

�ȝ��

Lucene 提供了灵�zȝ��接口使我们更加方便的设计我们�?Web 搜烦应用�E�序。如果你惛_��你的应用�E�序中加入搜索功能，那么 Lucene 是一个很好的选择。在设计你的下一个带有搜索功能的应用�E�序的时候可以考虑使用 Lucene 来提供搜索功能�?

�Ҏ(gu��)��铸就辉煌 2006-10-17 13:05 发表评论

JAVA EXCEL API

�Ҏ(gu��)��铸就辉煌 — Tue, 29 Aug 2006 09:32:00 GMT
使用Windows操作�pȝ��的朋友对Excel�Q�电(sh��)子表��|��一定不会陌生，但是要��用Java语言来操�U�Excel文�g�q�不是一件容易的事。在Web应用日益盛行的今天，通过Web来操作Excel文�g的需求越来越强烈�Q�目前较为流行的操作是在JSP或Servlet 中创��Z��个CSV �Q�comma separated values�Q�文�Ӟ��q�将�q�个文�g以MIME�Q�text/csv�c�d��q�回�l�浏览器�Q�接着��览器调用Excel�q�且昄��CSV文�g。这样只是说可以讉K��到Excel文�g�Q�但是还不能真正的操�U�Excel文�g�Q�本文将�l�大家一个惊喜，向大家介�l�一个开放源码项目，Java Excel API�Q��用它大家��可以方便地操纵Excel文�g了�?br />JAVA EXCEL API��?br />
Java Excel是一开放源码项目，通过它Java开发�h员可以读取Excel文�g的内宏V��创建新的Excel文�g、更新已�l�存在的Excel文�g。��用该API非Windows操作�pȝ��也可以通过�U�Java应用来处理Excel数据表。因为是使用Java�~�写的，所以我们在Web应用中可以通过JSP、Servlet来调用API实现对Excel数据表的讉K��?br />
现在发布的稳定版本是V2.0�Q�提供以下功能：

从Excel 95�?7�?000�{�格式的文�g中读取数据；
��d��Excel公式�Q�可以读取Excel 97以后的公式）�Q?
生成Excel数据表（格式为Excel 97�Q�；
支持字体、数字、日期的格式化；
支持单元格的阴媄操作�Q�以及颜色操作；
修改已经存在的数据表�Q?
现在�q�不支持以下功能�Q�但不久��׃��提供了：

不能够读取图表信息；
可以读，但是不能生成公式�Q��Q何类型公式最后的计算值都可以��d��Q?
应用�C�Z��

1 从Excel文�g��d��数据�?br />
Java Excel API既可以从本地文�g�pȝ��的一个文�?.xls)�Q�也可以从输入流中读取Excel数据表。读取Excel数据表的�W�一步是创徏Workbook(术语�Q�工作薄)�Q�下面的代码片段举例说明了应该如何操作：(完整代码见ExcelReading.java)

import java.io.*;
import jxl.*;
�?�?�?�?br />try
{
//构徏Workbook对象, 只读Workbook对象
//直接从本地文件创建Workbook
//从输入流创徏Workbook
   InputStream is = new FileInputStream(sourcefile);
   jxl.Workbook rwb = Workbook.getWorkbook(is);
}
catch (Exception e)
{
e.printStackTrace();
}

一旦创��Z��Workbook�Q�我们就可以通过它来讉K��Excel Sheet(术语�Q�工作表)。参考下面的代码片段�Q?br />

//获取�W�一张Sheet�?br />Sheet rs = rwb.getSheet(0);

我们既可能通过Sheet的名�U�来讉K��它，也可以通过下标来访问它。如果通过下标来访问的话，要注意的一�Ҏ(gu��)��下标�?开始，��像数组一栗��?br />
一旦得��C��Sheet�Q�我们就可以通过它来讉K��Excel Cell(术语�Q�单元格)。参考下面的代码片段�Q?br />

//获取�W�一行，�W�一列的�?br />Cell c00 = rs.getCell(0, 0);
String strc00 = c00.getContents();

//获取�W�一行，�W�二列的�?br />Cell c10 = rs.getCell(1, 0);
String strc10 = c10.getContents();

//获取�W�二行，�W�二列的�?br />Cell c11 = rs.getCell(1, 1);
String strc11 = c11.getContents();

System.out.println("Cell(0, 0)" + " value : " + strc00 + "; type : " + c00.getType());
System.out.println("Cell(1, 0)" + " value : " + strc10 + "; type : " + c10.getType());
System.out.println("Cell(1, 1)" + " value : " + strc11 + "; type : " + c11.getType());

如果仅仅是取得Cell的��|��我们可以方便地通过getContents()�Ҏ(gu��)��Q�它可以��Q何类型的Cell值都作�ؓ一个字�W�串�q�回。示例代码中Cell(0, 0)是文本型�Q�Cell(1, 0)是数字型�Q�Cell(1,1)是日期型�Q�通过getContents()�Q�三�U�类型的�q�回值都是字�W�型�?br />
如果有需要知道Cell内容的确切类型，API也提供了一�p�d��的方法。参考下面的代码片段�Q?br />

String strc00 = null;
double strc10 = 0.00;
Date strc11 = null;

Cell c00 = rs.getCell(0, 0);
Cell c10 = rs.getCell(1, 0);
Cell c11 = rs.getCell(1, 1);

if(c00.getType() == CellType.LABEL)
{
LabelCell labelc00 = (LabelCell)c00;
strc00 = labelc00.getString();
}
if(c10.getType() == CellType.NUMBER)
{
NmberCell numc10 = (NumberCell)c10;
strc10 = numc10.getValue();
}
if(c11.getType() == CellType.DATE)
{
DateCell datec11 = (DateCell)c11;
strc11 = datec11.getDate();
}

System.out.println("Cell(0, 0)" + " value : " + strc00 + "; type : " + c00.getType());
System.out.println("Cell(1, 0)" + " value : " + strc10 + "; type : " + c10.getType());
System.out.println("Cell(1, 1)" + " value : " + strc11 + "; type : " + c11.getType());

在得到Cell对象后，通过getType()�Ҏ(gu��)��可以获得该单元格的类型，然后与API提供的基本类型相匚w��Q�强制�{换成相应的类型，最后调用相应的取值方法getXXX()�Q�就可以得到��定�c�d��的倹{��API提供了以下基本类型，与Excel的数据格式相对应�Q�如下图所�C�：

每种�c�d��的具体意义，请参见Java Excel API Document�?br />
当你完成对Excel�?sh��)子表格数据的处理后�Q�一定要使用close()�Ҏ(gu��)��来关闭先前创建的对象�Q�以释放��d��数据表的�q�程中所占用的内存空��_��在读取大量数据时昑־��ؓ重要。参考如下代码片�D�：

//操作完成�Ӟ��关闭对象�Q�释攑֍�用的内存�I�间
rwb.close();

Java Excel API提供了许多访问Excel数据表的�Ҏ(gu��)��Q�在�q�里我只��要地介绍几个常用的方法，其它的方法请参考附录中的Java Excel API Document�?br />
Workbook�c�L��供的�Ҏ(gu��)��

1. int getNumberOfSheets()
获得工作薄（Workbook�Q�中工作表（Sheet�Q�的个数�Q�示例：

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
int sheets = rwb.getNumberOfSheets();

2. Sheet[] getSheets()
�q�回工作薄（Workbook�Q�中工作表（Sheet�Q�对象数�l�，�C�Z��Q?br />

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
Sheet[] sheets = rwb.getSheets();

3. String getVersion()
�q�回正在使用的API的版本号�Q�好像是没什么太大的作用�?br />

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
String apiVersion = rwb.getVersion();

Sheet接口提供的方�?br />
1) String getName()
获取Sheet的名�U�ͼ��C�Z��Q?br />

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
String sheetName = rs.getName();

2) int getColumns()
获取Sheet表中所包含的��d��敎ͼ��C�Z��Q?br />

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
int rsColumns = rs.getColumns();

3) Cell[] getColumn(int column)
获取某一列的所有单元格�Q�返回的是单元格对象数组�Q�示例：

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
Cell[] cell = rs.getColumn(0);

4) int getRows()
获取Sheet表中所包含的总行敎ͼ��C�Z��Q?br />

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
int rsRows = rs.getRows();

5) Cell[] getRow(int row)
获取某一行的所有单元格�Q�返回的是单元格对象数组�Q�示例子�Q?br />

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
Cell[] cell = rs.getRow(0);

6) Cell getCell(int column, int row)
获取指定单元格的对象引用�Q�需要注意的是它的两个参敎ͼ��W�一个是列数�Q�第二个是行敎ͼ��q�与通常的行、列�l�合有些不同�?br />

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
Cell cell = rs.getCell(0, 0);

2 生成新的Excel工作�?br />
下面的代码主要是向大家介�l�如何生成简单的Excel工作表，在这里单元格的内�Ҏ(gu��)��不带��M��修饰�?如：字体�Q�颜色等�{?�Q�所有的内容都作为字�W�串写入�?完整代码见ExcelWriting.java)

与读取Excel工作表相��|��首先要��用Workbook�cȝ��工厂�Ҏ(gu��)��创徏一个可写入的工作薄(Workbook)对象�Q�这里要注意的是�Q�只能通过API提供的工厂方法来创徏Workbook�Q�而不能��用WritableWorkbook的构造函敎ͼ�因�ؓ�c�WritableWorkbook的构造函��Cؓprotected�c�d��。示例代码片�D�如下：

import java.io.*;
import jxl.*;
import jxl.write.*;
�?�?�?�?br />try
{
//构徏Workbook对象, 只读Workbook对象
//Method 1�Q�创建可写入的Excel工作�?br />   jxl.write.WritableWorkbook wwb = Workbook.createWorkbook(new File(targetfile));

//Method 2�Q�将WritableWorkbook直接写入到输出流
/*
   OutputStream os = new FileOutputStream(targetfile);
   jxl.write.WritableWorkbook wwb = Workbook.createWorkbook(os);
*/
}
catch (Exception e)
{
e.printStackTrace();
}

API提供了两�U�方式来处理可写入的输出��，一�U�是直接生成本地文�g�Q�如果文件名不带全�\径的话，�~�省的文件会定位在当前目录，如果文�g名带有全路径的话�Q�则生成的Excel文�g则会定位在相应的目录�Q�另外一�U�是��Excel对象直接写入到输出流�Q�例如：用户通过��览器来讉K��Web服务器，如果HTTP头设�|�正��的话，��览器自动调用客��L��的Excel应用�E�序�Q�来昄��动态生成的Excel�?sh��)子表格�?br />
接下来就是要创徏工作表，创徏工作表的�Ҏ(gu��)��与创建工作薄的方法几乎一��P��同样是通过工厂模式�Ҏ(gu��)��获得相应的对象，该方法需要两个参敎ͼ�一个是工作表的名称�Q�另一个是工作表在工作薄中的位�|�，参考下面的代码片段�Q?br />

//创徏Excel工作�?br />jxl.write.WritableSheet ws = wwb.createSheet("Test Sheet 1", 0);

"�q�锅也支好了�Q�材料也准备齐全了，可以开始下锅了�Q?�Q�现在要做的只是实例化API所提供的Excel基本数据�c�d��Q��ƈ��它们添加到工作表中��可以了�Q�参考下面的代码片段�Q?br />

//1.��d��Label对象
jxl.write.Label labelC = new jxl.write.Label(0, 0, "This is a Label cell");
ws.addCell(labelC);

//��d��带有字型Formatting的对�?br />jxl.write.WritableFont wf = new jxl.write.WritableFont(WritableFont.TIMES, 18, WritableFont.BOLD, true);
jxl.write.WritableCellFormat wcfF = new jxl.write.WritableCellFormat(wf);
jxl.write.Label labelCF = new jxl.write.Label(1, 0, "This is a Label Cell", wcfF);
ws.addCell(labelCF);

//��d��带有字体颜色Formatting的对�?br />jxl.write.WritableFont wfc = new jxl.write.WritableFont(WritableFont.ARIAL, 10, WritableFont.NO_BOLD, false,
Underlinestyle.NO_UNDERLINE, jxl.format.Colour.RED);
jxl.write.WritableCellFormat wcfFC = new jxl.write.WritableCellFormat(wfc);
jxl.write.Label labelCFC = new jxl.write.Label(1, 0, "This is a Label Cell", wcfFC);
ws.addCell(labelCF);

//2.��d��Number对象
jxl.write.Number labelN = new jxl.write.Number(0, 1, 3.1415926);
ws.addCell(labelN);

//��d��带有formatting的Number对象
jxl.write.NumberFormat nf = new jxl.write.NumberFormat("#.##");
jxl.write.WritableCellFormat wcfN = new jxl.write.WritableCellFormat(nf);
jxl.write.Number labelNF = new jxl.write.Number(1, 1, 3.1415926, wcfN);
ws.addCell(labelNF);

//3.��d��Boolean对象
jxl.write.Boolean labelB = new jxl.write.Boolean(0, 2, false);
ws.addCell(labelB);

//4.��d��DateTime对象
jxl.write.DateTime labelDT = new jxl.write.DateTime(0, 3, new java.util.Date());
ws.addCell(labelDT);

//��d��带有formatting的DateFormat对象
jxl.write.DateFormat df = new jxl.write.DateFormat("dd MM yyyy hh:mm:ss");
jxl.write.WritableCellFormat wcfDF = new jxl.write.WritableCellFormat(df);
jxl.write.DateTime labelDTF = new jxl.write.DateTime(1, 3, new java.util.Date(), wcfDF);
ws.addCell(labelDTF);

�q�里有两点大家要引�v大家的注意。第一点，在构造单元格�Ӟ��单元格在工作表中的位�|�就已经��定了。一旦创建后�Q�单元格的位�|�是不能够变更的�Q�尽��单元格的内�Ҏ(gu��)��可以改变的。第二点�Q�单元格的定位是按照下面�q�样的规�?column, row)�Q�而且下标都是�?开始，例如�Q�A1被存储在(0, 0)�Q�B1被存储在(1, 0)�?br />
最后，不要忘记关闭打开的Excel工作薄对象，以释攑֍�用的内存�Q�参见下面的代码片段�Q?br />

//写入Exel工作�?br />wwb.write();

//关闭Excel工作薄对�?br />wwb.close();

�q�可能与��d��Excel文�g的操作有��少不同�Q�在关闭Excel对象之前�Q�你必须要先调用write()�Ҏ(gu��)��Q�因为先前的操作都是存储在缓存中的，所以要通过该方法将操作的内容保存在文�g中。如果你先关闭了Excel对象�Q�那么只能得��C��张空的工作薄了�?br />
3 拯��、更新Excel工作�?br />
接下来简要介�l�一下如何更��C��个已�l�存在的工作薄，主要是下面二步操作，�W�一步是构造只�ȝ��Excel工作薄，�W�二步是利用已经创徏的Excel工作薄创建新的可写入的Excel工作薄，参考下面的代码片段�Q?完整代码见ExcelModifying.java)

//创徏只读的Excel工作薄的对象
jxl.Workbook rw = jxl.Workbook.getWorkbook(new File(sourcefile));

//创徏可写入的Excel工作薄对�?br />jxl.write.WritableWorkbook  wwb = Workbook.createWorkbook(new File(targetfile), rw);

//��d��W�一张工作表
jxl.write.WritableSheet ws = wwb.getSheet(0);

//获得�W�一个单元格对象
jxl.write.WritableCell wc = ws.getWritableCell(0, 0);

//判断单元格的�c�d��, 做出相应的�{�?br />if(wc.getType() == CellType.LABEL)
{
Label l = (Label)wc;
   l.setString("The value has been modified.");
}

//写入Excel对象
wwb.write();

//关闭可写入的Excel对象
wwb.close();

//关闭只读的Excel对象
rw.close();

之所以��用这�U�方式构建Excel对象�Q�完全是因�ؓ效率的原因，因�ؓ上面的示例才是API的主要应用。�ؓ了提高性能�Q�在��d��工作表时�Q�与数据相关的一些输��Z��息，所有的格式信息�Q�如�Q�字体、颜色等�{�，是不被处理的�Q�因为我们的目的是获得行数据的��|��既��没有了修饎ͼ�也不会对行数据的��g�生什么媄响。唯一的不利之处就是，在内存中会同时保存两个同��L��工作表，�q�样当工作表体积比较大时�Q�会占用相当大的内存�Q�但现在好像内存的大��ƈ不是什么关键因素了�?br />
一旦获得了可写入的工作表对象，我们��可以对单元格对象进行更新的操作了，在这里我们不必调用API提供的add()�Ҏ(gu��)��Q�因为单元格已经于工作表当中�Q�所以我们只需要调用相应的setXXX()�Ҏ(gu��)��Q�就可以完成更新的操作了�?br />
��单元格原有的格式化修饰是不能去掉的�Q�我们还是可以将新的单元��g��饰加上去�Q�以使单元格的内容以不同的�Ş式表现�?br />
新生成的工作表对象是可写入的�Q�我们除了更新原有的单元格外�Q�还可以��d��新的单元格到工作表中�Q�这与示�?的操作是完全一��L��?br />
最后，不要忘记调用write()�Ҏ(gu��)��Q�将更新的内容写入到文�g中，然后关闭工作薄对象，�q�里有两个工作薄对象要关闭，一个是只读的，另外一个是可写入的�?br />
以上摘自IBM�|�站

�Ҏ(gu��)��铸就辉煌 2006-08-29 17:32 发表评论

字符�Q�字节和�~�码

�Ҏ(gu��)��铸就辉煌 — Fri, 23 Jun 2006 03:30:00 GMT

[原创文章�Q��{载请保留或注明出处：http://www.regexlab.com/zh/encoding.htm]

�U�别�Q�中�U?/p>

摘要�Q�本文介�l�了字符与编码的发展�q�程�Q�相��x��늚�正确理解。�D例说明了一些实际应用中�Q�编码的实现�Ҏ(gu��)��。然后，本文讲述了通常对字�W�与�~�码的几�U�误解，�׃��q�些误解而导致�ؕ码��生的原因�Q�以及消除�ؕ码的办法。本文的内容�늛�了“中文问题”，“�ؕ码问题”�?/p>
掌握�~�码问题的关键是正确地理解相��x��念，�~�码所涉及的技术其实是很简单的。因此，阅读本文旉��要慢��d��惻I��多思考�?/p>

引言

“字�W�与�~�码”是一个被�l�常讨论的话题。即使这��P��时常出现的�ؕ码仍然困扰着大家。虽然我们有很多的办法可以用来消除�ؕ码，但我们�ƈ不一定理解这些办法的内在原理。而有的�ؕ码��生的原因�Q�实际上�׃��底层代码本��n有问题所��D��的。因此，不仅是初学者会对字�W�编码感到模�p�，有的底层开发�h员同样对字符�~�码�~�Z��准确的理解�?/p>
1. �~�码问题的由来，相关概念的理�?/h4>
1.1 字符与编码的发展

从计��机对多国语�a�的支持角度看�Q�大致可以分��Z��个阶�D�：

　 �pȝ��内码 说明 �pȝ��

阶段一 ASCII 计算机刚开始只支持��p��Q�其它语�a�不能够在计算��Z��存储和显�C��?/td> 英文 DOS

阶段�?/td> ANSI�~�码
�Q�本地化�Q?/td> ��Z��计算机支持更多语�a��Q�通常使用 0x80~0xFF 范围�?2 个字节来表示 1 个字�W�。比如：汉字 '�? 在中文操作系�l�中�Q��?[0xD6,0xD0] �q�两个字节存储�?br />
不同的国家和地区制定了不同的标准�Q�由此��生了 GB2312, BIG5, JIS �{�各自的�~�码标准。这些��?2 个字节来代表一个字�W�的各种汉字延�׾~�码方式�Q�称�?b> ANSI �~�码。在��体中文系�l�下�Q�ANSI �~�码代表 GB2312 �~�码�Q�在日文操作�pȝ��下，ANSI �~�码代表 JIS �~�码�?br />
不同 ANSI �~�码之间互不兼容�Q�当信息在国际间交流�Ӟ��无法��属于两�U�语�a�的文字，存储在同一�D?b> ANSI �~�码的文本中�?/td> 中文 DOS�Q�中�?Windows 95/98�Q�日�?Windows 95/98

阶段�?/td> UNICODE
�Q�国际化�Q?/td> ��Z��使国际间信息交流更加方便�Q�国际组�l�制定了 UNICODE 字符�?/b>�Q��ؓ各种语言中的每一个字�W�设定了�l�一�q�且唯一的数字编��P��以满��语言、跨�q�_��q�行文本转换、处理的要求�?/td> Windows NT/2000/XP�Q�Linux�Q�Java

字符串在内存中的存放�Ҏ(gu��)��Q?/p>
�?ASCII 阶段�Q?b>单字节字�W�串使用一个字节存放一个字�W�（SBCS�Q�。比如，"Bob123" 在内存中为：

42 6F 62 31 32 33 00

B o b 1 2 3 \0

在��?ANSI �~�码支持多种语言阶段�Q�每个字�W��用一个字节或多个字节来表�C�（MBCS�Q�，因此�Q�这�U�方式存攄��字符也被�U�C��多字节字�W?/b>。比如，"中文123" 在中�?Windows 95 内存中�ؓ7个字节，每个汉字�?个字节，每个英文和数字字�W�占1个字节：

D6 D0 CE C4 31 32 33 00

�?/td> �?/td> 1 2 3 \0

�?UNICODE 被采用之后，计算机存攑֭��W�串�Ӟ��改�ؓ存放每个字符�?UNICODE 字符集中的序受��目前计��机一般��?2 个字节（16 位）来存放一个序��P��DBCS�Q�，因此�Q�这�U�方式存攄��字符也被�U�C��宽字节字�W?/b>。比如，字符�?"中文123" �?Windows 2000 下，内存中实际存攄��?5 个序��P��

2D 4E 87 65 31 00 32 00 33 00 00 00      �?�?x86 CPU 中，低字节在�?/font>

�?/td> �?/td> 1 2 3 \0 　

一共占 10 个字节�?/p>
1.2 字符�Q�字节，字符�?/h5>
理解�~�码的关键，是要把字�W�的概念和字节的概念理解准确。这两个概念�Ҏ(gu��)��h��Q�我们在此做一下区分：

　 概念描述 举例

字符 ��Z��使用的记��P��抽象意义上的一个符受��?/td> '1', '�?, 'a', '$', '�K?, …�?/td>

字节计算��Z��存储数据的单元，一�?位的二进制数�Q�是一个很具体的存储空间�?/td> 0x01, 0x45, 0xFA, …�?/td>

ANSI
字符�?/td> 在内存中�Q�如果“字�W�”是�?ANSI �~�码形式存在的，一个字�W�可能��用一个字节或多个字节来表�C�，那么我们�U�这�U�字�W�串�?ANSI 字符�?/b>或�?b>多字节字�W�串�?/td> "中文123"
�Q�占7字节�Q?/font>

UNICODE
字符�?/td> 在内存中�Q�如果“字�W�”是以在 UNICODE 中的序号存在的，那么我们�U�这�U�字�W�串�?UNICODE 字符�?/b>或�?b>宽字节字�W�串�?/td> L"中文123"
�Q�占10字节�Q?/font>

�׃��不同 ANSI �~�码所规定的标准是不相同的�Q�因此，对于一个给定的多字节字�W�串�Q�我们必��ȝ��道它采用的是哪一�U�编码规则，才能够知道它包含了哪些“字�W�”。而对�?UNICODE 字符�?/b>来说�Q�不��在什么环境下�Q�它所代表的“字�W�”内�Ҏ(gu��)��L��不变的�?/p>

回页�?/a>

1.3 字符集与�~�码

各个国家和地区所制定的不�?ANSI �~�码标准中，都只规定了各自语�a�所需的“字�W�”。比如：汉字标准�Q�GB2312�Q�中没有规定韩国语字�W�怎样存储。这�?ANSI �~�码标准所规定的内容包含两层含义：

使用哪些字符。也��是说哪些汉字，字母和符号会被收入标准中。所包含“字�W�”的集合��叫做�?b>字符�?/b>”�?

规定每个“字�W�”分别用一个字节还是多个字节存储，用哪些字节来存储�Q�这个规定就叫做�?b>�~�码”�?

各个国家和地区在制定�~�码标准的时候，“字�W�的集合”和“编码”一般都是同时制定的。因此，�q�_��我们所说的“字�W�集”，比如�Q�GB2312, GBK, JIS �{�，除了有“字�W�的集合”这层含义外�Q�同时也包含了“编码”的含义�?/p>
�?b>UNICODE 字符�?/b>”包含了各种语言中��用到的所有“字�W�”。用来给 UNICODE 字符集编码的标准有很多种�Q�比如：UTF-8, UTF-7, UTF-16, UnicodeLittle, UnicodeBig �{��?/p>

回页�?/a>

1.4 常用的编码简�?/h5>
��单介�l�一下常用的�~�码规则�Q��ؓ后边的章节做一个准备。在�q�里�Q�我们根据编码规则的特点�Q�把所有的�~�码分成三类�Q?/p>

分类 �~�码标准 说明

单字节字�W�编�?/td> ISO-8859-1 最��单的�~�码规则�Q�每一个字节直接作��Z��?UNICODE 字符。比如，[0xD6, 0xD0] �q�两个字节，通过 iso-8859-1 转化为字�W�串�Ӟ��直接得�?[0x00D6, 0x00D0] 两个 UNICODE 字符�Q�即 "ÖÐ"�?br />
反之�Q�将 UNICODE 字符串通过 iso-8859-1 转化为字节串�Ӟ��只能正常转化 0~255 范围的字�W��?/td>

ANSI �~�码 GB2312,
BIG5,
Shift_JIS,
ISO-8859-2 …�?/td> �?UNICODE 字符串通过 ANSI �~�码转化为“字节串”时�Q�根据各自编码的规定�Q�一�?UNICODE 字符可能转化成一个字节或多个字节�?br />
反之�Q�将字节串�{化成字符串时�Q�也可能多个字节转化成一个字�W�。比如，[0xD6, 0xD0] �q�两个字节，通过 GB2312 转化为字�W�串�Ӟ��得�?[0x4E2D] 一个字�W�，�?'�? 字�?br />
“ANSI �~�码”的特点�Q?br />1. �q�些“ANSI �~�码标准”都只能处理各自语言范围之内�?UNICODE 字符�?br />2. “UNICODE 字符”与“�{换出来的字节”之间的关系是�h��定的�?/td>

UNICODE �~�码 UTF-8,
UTF-16, UnicodeBig …�?/td> 与“ANSI �~�码”类似的�Q�把字符串通过 UNICODE �~�码转化成“字节串”时�Q�一�?UNICODE 字符可能转化成一个字节或多个字节�?br />
与“ANSI �~�码”不同的是：
1. �q�些“UNICODE �~�码”能够处理所有的 UNICODE 字符�?br />2. “UNICODE 字符”与“�{换出来的字节”之间是可以通过计算得到的�?/td>

我们实际上没有必要去��q��每一�U�编码具体把某一个字�W�编码成了哪几个字节�Q�我们只需要知道“编码”的概念��是把“字�W�”�{化成“字节”就可以了。对于“UNICODE �~�码”，�׃��它们是可以通过计算得到的，因此�Q�在�Ҏ(gu��)��的场合，我们可以��M��解某一�U�“UNICODE �~�码”是怎样的规则�?/p>

回页�?/a>

2. 字符与编码在�E�序中的实现

2.1 �E�序中的字符与字�?/h5>
�?C++ �?Java 中，用来代表“字�W�”和“字节”的数据�c�d��Q�以及进行编码的�Ҏ(gu��)��Q?/p>

�c�d��或操�?/b> C++ Java

字符 wchar_t char

字节 char byte

ANSI 字符�?/td> char[] byte[]

UNICODE 字符�?/td> wchar_t[] String

字节东y��字符�?/td> mbstowcs(), MultiByteToWideChar() string = new String(bytes, "encoding")

字符东y��字节�?/td> wcstombs(), WideCharToMultiByte() bytes = string.getBytes("encoding")

以上需要注意几点：

Java 中的 char 代表一个“UNICODE 字符�Q�宽字节字符�Q�”，�?C++ 中的 char 代表一个字节�?

MultiByteToWideChar() �?WideCharToMultiByte() �?Windows API 函数�?

回页�?/a>

2.2 C++ 中相兛_��现方�?/h5>
声明一�D�字�W�串帔R��Q?/p>

// ANSI 字符�Ԍ��内容长度 7 字节
char      sz[20] = "中文123";

// UNICODE 字符�Ԍ��内容长度 5 �?wchar_t�Q?0 字节�Q?/span>
wchar_t wsz[20] = L"\x4E2D\x6587\x0031\x0032\x0033";

UNICODE 字符串的 I/O 操作�Q�字�W�与字节的�{换操作：

// �q�行时设定当�?ANSI �~�码�Q�VC 格式
setlocale(LC_ALL, ".936");

// GCC 中格�?/span>
setlocale(LC_ALL, "zh_CN.GBK");

// Visual C++ 中��用小�?%s�Q�按�?setlocale 指定�~�码输出到文�?br />// GCC 中��用大�?%S
fwprintf(fp, L"%s\n", wsz);

// �?UNICODE 字符串按�?setlocale 指定的编码�{换成字节
wcstombs(sz, wsz, 20);
// 把字节串按照 setlocale 指定的编码�{换成 UNICODE 字符�?br />mbstowcs(wsz, sz, 20);

�?Visual C++ 中，UNICODE 字符串常量有更简单的表示�Ҏ(gu��)��。如果源�E�序的编码与当前默认 ANSI �~�码不符�Q�则需要��?#pragma setlocale�Q�告诉编译器源程序��用的�~�码�Q?/p>

// 如果源程序的�~�码与当前默�?ANSI �~�码不一��_��
// 则需要此行，�~�译时用来指明当前源�E�序使用的编�?/font>
#pragma setlocale (".936")

// UNICODE 字符串常量，内容长度 10 字节
wchar_t wsz[20] = L"中文123";

以上需要注�?#pragma setlocale �?setlocale(LC_ALL, "") 的作用是不同的，#pragma setlocale 在编译时起作用，setlocale() 在运行时起作用�?/p>

回页�?/a>

2.3 Java 中相兛_��现方�?/h5>
字符串类 String 中的内容�?UNICODE 字符�Ԍ��

// Java 代码�Q�直接写中文
String string = "中文123";

// 得到长度�?5�Q�因为是 5 个字�W?/span>
System.out.println(string.length());

字符�?I/O 操作�Q�字�W�与字节转换操作。在 Java �?java.io.* 中，以“Stream”结��c�M��般是用来操作“字节串”的�c�，以“Reader”，“Writer”结��c�M��般是用来操作“字�W�串”的�c�R�?/p>

// 字符串与字节串间�怺�转化

// 按照 GB2312 得到字节�Q�得到多字节字符�Ԍ��
byte [] bytes = string.getBytes("GB2312");

// 从字节按�?GB2312 得到 UNICODE 字符�?/span>
string = newString(bytes, "GB2312");

// 要将 String 按照某种�~�码写入文本文�g�Q�有两种�Ҏ(gu��)��Q?br />
// �W�一�U�办法：�?Stream �c�d��入已�l�按照指定编码�{化好的字节串
OutputStream os = new FileOutputStream("1.txt");
os.write(bytes);
os.close();

// �W�二�U�办法：构造指定编码的 Writer 来写入字�W�串
Writer ow = new OutputStreamWriter(new FileOutputStream("2.txt"), "GB2312");
ow.write(string);
ow.close();

/* 最后得到的 1.txt �?2.txt 都是 7 个字�?*/

如果 java 的源�E�序�~�码与当前默�?ANSI �~�码不符�Q�则在编译的时候，需要指明一下源�E�序的编码。比如：

E:\>javac -encoding BIG5 Hello.java

以上需要注意区分源�E�序的编码与 I/O 操作的编码，前者是在编译时起作用，后者是在运行时起作用�?/p>

回页�?/a>

3. 几种误解�Q�以及�ؕ码��生的原因和解军_��?/h4>
3.1 �Ҏ(gu��)��产生的误�?/h5>

　 对编码的误解

误解一在将“字节串”�{化成“UNICODE 字符东y��时�Q�比如在��d��文本文�g�Ӟ��或者通过�|�络传输文本�Ӟ��Ҏ(gu��)��“字节串”简单地作�ؓ单字节字�W�串�Q�采用每“一个字节”就是“一个字�W�”的�Ҏ(gu��)��q�行转化�?br />
而实际上�Q�在非英文的环境中，应该��“字节串”作�?ANSI 字符�Ԍ��采用适当的编码来得到 UNICODE 字符�Ԍ��有可能“多个字节”才能得到“一个字�W�”�?br />
通常�Q�一直在英文环境下做开发的�E�序员们�Q�容易有�q�种误解�?/td>

误解�?/td> �?DOS�Q�Windows 98 �{�非 UNICODE 环境下，字符串都是以 ANSI �~�码的字节�Ş式存在的。这�U�以字节形式存在的字�W�串�Q�必��ȝ��道是哪种�~�码才能被正��地使用。这使我们�Ş成了一个惯性思维�Q�“字�W�串的编码”�?br />
�?UNICODE 被支持后�Q�Java 中的 String 是以字符的“序号”来存储的，不是以“某�U�编码的字节”来存储的，因此已经不存在“字�W�串的编码”这个概念了。只有在“字�W�串”与“字节串”�{化时�Q�或者，��一个“字节串”当成一�?ANSI 字符串时�Q�才有编码的概念�?br />
不少的�h都有�q�个误解�?/td>

�W�一�U�误解，往往是导致�ؕ码��生的原因。第二种误解�Q�往往��D��本来�Ҏ(gu��)��U�正的�ؕ码问题变得更复杂�?/p>
在这里，我们可以看到�Q�其中所讲的“误解一”，即采用每“一个字节”就是“一个字�W�”的转化�Ҏ(gu��)��Q�实际上也就�{�同于采�?iso-8859-1 �q�行转化。因此，我们常常使用 bytes = string.getBytes("iso-8859-1") 来进行逆向操作�Q�得到原始的“字节串”。然后再使用正确�?ANSI �~�码�Q�比�?string = new String(bytes, "GB2312")�Q�来得到正确的“UNICODE 字符东y��?/p>

回页�?/a>

3.2 �?UNICODE �E�序在不同语�a�环境间移植时的�ؕ�?/h5>
�?UNICODE �E�序中的字符�Ԍ��都是以某�U?ANSI �~�码形式存在的。如果程序运行时的语�a�环境与开发时的语�a�环境不同�Q�将会导�?ANSI 字符串的昄��p�|�?/p>
比如�Q�在日文环境下开发的�?UNICODE 的日文程序界面，拿到中文环境下运行时�Q�界面上��显�C�Zؕ码。如果这个日文程序界面改为采�?UNICODE 来记录字�W�串�Q�那么当在中文环境下�q�行�Ӟ��界面上将可以昄��正常的日文�?/p>
�׃��客观原因�Q�有时候我们必��d��中文操作�pȝ��下运行非 UNICODE 的日文��Y�Ӟ��q�时我们可以采用一些工��P��比如�Q�南极星�Q�AppLocale �{�，暂时的模拟不同的语言环境�?/p>

回页�?/a>

3.3 �|�页提交字符�?/h5>
当页面中的表单提交字�W�串�Ӟ��首先把字�W�串按照当前��面的编码，转化成字节串。然后再��每个字节�{化成 "%XX" 的格式提交到 Web 服务器。比如，一个编码�ؓ GB2312 的页面，提交 "�? �q�个字符串时�Q�提交给服务器的内容�?"%D6%D0"�?/p>
在服务器端，Web 服务器把收到�?"%D6%D0" 转化�?[0xD6, 0xD0] 两个字节�Q�然后再�Ҏ(gu��)�� GB2312 �~�码规则得到 "�? 字�?/p>
�?Tomcat 服务器中�Q�request.getParameter() 得到��q��Ӟ��常常是因为前面提到的“误解一”造成的。默认情况下�Q�当提交 "%D6%D0" �l?Tomcat 服务器时�Q�request.getParameter() ��返�?[0x00D6, 0x00D0] 两个 UNICODE 字符�Q�而不是返回一�?"�? 字符。因此，我们需要��?bytes = string.getBytes("iso-8859-1") 得到原始的字节串�Q�再�?string = new String(bytes, "GB2312") 重新得到正确的字�W�串 "�?�?/p>

回页�?/a>

3.4 从数据库��d��字符�?/h5>
通过数据库客��L��Q�比�?ODBC �?JDBC�Q�从数据库服务器中读取字�W�串�Ӟ��客户端需要从服务器获知所使用�?ANSI �~�码。当数据库服务器发送字节流�l�客��L��Ӟ��客户端负责将字节��按照正��的�~�码转化�?UNICODE 字符丌Ӏ?/p>
如果从数据库��d��字符串时得到��q��Q�而数据库中存攄��数据又是正确的，那么往往�q�是因�ؓ前面提到的“误解一”造成的。解决的办法�q�是通过 string = new String( string.getBytes("iso-8859-1"), "GB2312") 的方法，重新得到原始的字节串�Q�再重新使用正确的编码�{化成字符丌Ӏ?/p>

回页�?/a>

3.5 �?sh��)子邮�g中的字符�?/h5>
当一�D?Text 或�?HTML 通过�?sh��)子邮�g传送时�Q�发送的内容首先通过一�U�指定的字符�~�码转化成“字节串”，然后再把“字节串”通过一�U�指定的传输�~�码�Q�Content-Transfer-Encoding�Q�进行�{化得到另一东y��字节串”。比如，打开一��电(sh��)子邮件源代码�Q�可以看到类似的内容�Q?/p>

Content-Type: text/plain;
        charset="gb2312"
Content-Transfer-Encoding: base64

sbG+qcrQuqO17cf4yee74bGjz9W7+b3wudzA7dbQ0MQNCg0KvPKzxqO6uqO17cnnsaPW0NDEDQoNCg==

最常用�?Content-Transfer-Encoding �?Base64 �?Quoted-Printable 两种。在对二�q�制文�g或者中文文本进行�{化时�Q�Base64 得到的“字节串”比 Quoted-Printable 更短。在对英文文本进行�{化时�Q�Quoted-Printable 得到的“字节串”比 Base64 更短�?/p>
邮�g的标题，用了一�U�更��短的格式来标注“字�W�编码”和“传输编码”。比如，标题内容�?"�?�Q�则在邮件源代码中表�C�Zؓ�Q?/p>

// 正确的标题格�?/span>
Subject: =?GB2312?B?1tA=?=

其中�Q?/p>

�W�一个�??”与�?”中间的部分指定了字�W�编码，在这个例子中指定的是 GB2312�?

�?”与�?”中间的“B”代�?Base64。如果是“Q”则代表 Quoted-Printable�?

最后�?”与�?=”之间的部分�Q�就是经�q?GB2312 转化成字节串�Q�再�l�过 Base64 转化后的标题内容�?

如果“传输编码”改�?Quoted-Printable�Q�同��P��如果标题内容�?"�?�Q?/p>

// 正确的标题格�?/span>
Subject: =?GB2312?Q?=D6=D0?=

如果阅读邮�g时出��Cؕ码，一般是因�ؓ“字�W�编码”或“传输编码”指定有误，或者是没有指定。比如，有的发邮件组件在发送邮件时�Q�标�?"�?�Q?/p>

// 错误的标题格�?/span>
Subject: =?ISO-8859-1?Q?=D6=D0?=

�q�样的表�C�，实际上是明确指明了标题�ؓ [0x00D6, 0x00D0]�Q�即 "ÖÐ"�Q�而不�?"�?�?/p>

回页�?/a>

4. 几种错误理解的纠�?/h4>
误解�Q�“ISO-8859-1 是国际编码？�?/h5>
非也。iso-8859-1 只是单字节字�W�集中最��单的一�U�，也就是“字节编号”与“UNICODE 字符�~�号”一致的那种�~�码规则。当我们要把一个“字节串”�{化成“字�W�串”，而又不知道它是哪一�U?ANSI �~�码�Ӟ��先暂时地把“每一个字节”作为“一个字�W�”进行�{化，不会造成信息丢失。然后再使用 bytes = string.getBytes("iso-8859-1") 的方法可恢复到原始的字节丌Ӏ?/p>
误解�Q�“Java 中，怎样知道某个字符串的内码�Q��?/h5>
Java 中，字符串类 java.lang.String 处理的是 UNICODE 字符�Ԍ��不是 ANSI 字符丌Ӏ�我们只需要把字符串作为“抽象的�W�号的串”来看待。因此不存在字符串的内码的问题�?/p>

�Ҏ(gu��)��铸就辉煌 2006-06-23 11:30 发表评论

�Ҏ(gu��)��铸就辉煌 — Fri, 02 Jun 2006 09:21:00 GMT
     摘要: 1 、重要的语言变化 l         泛型�Q? Generics �Q? l         ...  阅读全文

�Ҏ(gu��)��铸就辉煌 2006-06-02 17:21 发表评论

用java诅R��写Excel

�Ҏ(gu��)��铸就辉煌 — Mon, 22 May 2006 07:51:00 GMT
原作者：SonyMusic

读：rrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
在Java中读取Excel文�g的内�?br />在这里，我��用的是一个叫Java Excel API的东西，�c�M��的还有jakarta的POI�Q�不�q�感觉那�?br />太复杂了点儿。而且jxl对中文的支持相当的好�Q�至��我在用的过�E�中一炚w��题没出�?br />
一、下载地址
http://sourceforge.net/project/showfiles.php?group_id=79926

二、特�?br />可以��d��Excel 95, 97, 2000文�g
可以��L��写Excel 97及其以后版本的的公式�Q�不�q�我发现好像有bug�Q?br />生成Excel 97格式的电(sh��)子表�?br />支持字体、数字和日期格式�?br />支持单元格的颜色和阴�?br />可以�~�辑现有的文�?

三、读文�g
//声明一下，记得后面要关闭哦。�?br />Workbook workbook = null;

try {
workbook = Workbook.getWorkbook(new File("d:\\temp\\TestRead.xls"));
} catch (Exception e) {
throw new Exception("file to import not found!");
}

Sheet sheet = workbook.getSheet(0);
Cell cell = null;

int columnCount=3;
int rowCount=sheet.getRows();
for (int i = 0; i for (int j = 0; j //注意�Q�这里的两个参数�Q�第一个是表示列的�Q�第二才表示�?br />cell=sheet.getCell(j, i);
//要根据单元格的类型分别做处理�Q�否则格式化�q�的内容可能会不正确
if(cell.getType()==CellType.NUMBER){
System.out.print(((NumberCell)cell).getValue());
}
else if(cell.getType()==CellType.DATE){
System.out.print(((DateCell)cell).getDate());
}
else{
System.out.print(cell.getContents());
}

//System.out.print(cell.getContents());
System.out.print("\t");
}
System.out.print("\n");
}
//关闭它，否则会有内存泄露
workbook.close();

写：wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
在Java中向Excel文�g写入内容

四、导出数据到Excel文�g�?br />下面的例子，讄��了数字、日期的格式�Q�还有字体，颜色�{��?br />
File tempFile=new File("d:/temp/output.xls");
WritableWorkbook workbook = Workbook.createWorkbook(tempFile);
WritableSheet sheet = workbook.createSheet("TestCreateExcel", 0);

//一些��时变量，用于写到excel�?br />Label l=null;
jxl.write.Number n=null;
jxl.write.DateTime d=null;

//预定义的一些字体和格式�Q�同一个Excel中最好不要有太多格式
WritableFont headerFont = new WritableFont(WritableFont.ARIAL, 12, WritableFont.BOLD, false, Underlinestyle.NO_UNDERLINE, jxl.format.Colour.BLUE);
WritableCellFormat headerFormat = new WritableCellFormat (headerFont);

WritableFont titleFont = new WritableFont(WritableFont.ARIAL, 10, WritableFont.NO_BOLD, false, Underlinestyle.NO_UNDERLINE, jxl.format.Colour.RED);
WritableCellFormat titleFormat = new WritableCellFormat (titleFont);

WritableFont detFont = new WritableFont(WritableFont.ARIAL, 10, WritableFont.NO_BOLD, false, Underlinestyle.NO_UNDERLINE, jxl.format.Colour.BLACK);
WritableCellFormat detFormat = new WritableCellFormat (detFont);

NumberFormat nf=new NumberFormat("0.00000"); //用于Number的格�?br />WritableCellFormat priceFormat = new WritableCellFormat (detFont, nf);

DateFormat df=new DateFormat("yyyy-MM-dd");//用于日期�?br />WritableCellFormat dateFormat = new WritableCellFormat (detFont, df);

//剩下的事情，��是用上面的内容和格式创��Z��些单元格�Q�再加到sheet�?br />l=new Label(0, 0, "用于��试的Excel文�g", headerFormat);
sheet.addCell(l);

//add Title
int column=0;
l=new Label(column++, 2, "标题", titleFormat);
sheet.addCell(l);
l=new Label(column++, 2, "日期", titleFormat);
sheet.addCell(l);
l=new Label(column++, 2, "货币", titleFormat);
sheet.addCell(l);
l=new Label(column++, 2, "��h��", titleFormat);
sheet.addCell(l);

//add detail
int i=0;
column=0;
l=new Label(column++, i+3, "标题 "+i, detFormat);
sheet.addCell(l);
d=new DateTime(column++, i+3, new java.util.Date(), dateFormat);
sheet.addCell(d);
l=new Label(column++, i+3, "CNY", detFormat);
sheet.addCell(l);
n=new jxl.write.Number(column++, i+3, 5.678, priceFormat);
sheet.addCell(n);

i++;
column=0;
l=new Label(column++, i+3, "标题 "+i, detFormat);
sheet.addCell(l);
d=new DateTime(column++, i+3, new java.util.Date(), dateFormat);
sheet.addCell(d);
l=new Label(column++, i+3, "SGD", detFormat);
sheet.addCell(l);
n=new jxl.write.Number(column++, i+3, 98832, priceFormat);
sheet.addCell(n);

//讄��列的宽度
column=0;
sheet.setColumnView(column++, 20);
sheet.setColumnView(column++, 20);
sheet.setColumnView(column++, 10);
sheet.setColumnView(column++, 20);

workbook.write();
workbook.close();

�Ҏ(gu��)��铸就辉煌 2006-05-22 15:51 发表评论

	�pȝ��内码	说明	�pȝ��
阶段一	ASCII	计算机刚开始只支持��p��Q�其它语�a�不能够在计算��Z��存储和显�C��?/td>	英文 DOS
阶段�?/td>	ANSI�~�码 �Q�本地化�Q?/td>	��Z��计算机支持更多语�a��Q�通常使用 0x80~0xFF 范围�?2 个字节来表示 1 个字�W�。比如：汉字 '�? 在中文操作系�l�中�Q��?[0xD6,0xD0] �q�两个字节存储�?br /> 不同的国家和地区制定了不同的标准�Q�由此��生了 GB2312, BIG5, JIS �{�各自的�~�码标准。这些��?2 个字节来代表一个字�W�的各种汉字延�׾~�码方式�Q�称�?b> ANSI �~�码。在��体中文系�l�下�Q�ANSI �~�码代表 GB2312 �~�码�Q�在日文操作�pȝ��下，ANSI �~�码代表 JIS �~�码�?br /> 不同 ANSI �~�码之间互不兼容�Q�当信息在国际间交流�Ӟ��无法��属于两�U�语�a�的文字，存储在同一�D?b> ANSI �~�码的文本中�?/td>	中文 DOS�Q�中�?Windows 95/98�Q�日�?Windows 95/98
阶段�?/td>	UNICODE �Q�国际化�Q?/td>	��Z��使国际间信息交流更加方便�Q�国际组�l�制定了 UNICODE 字符�?/b>�Q��ؓ各种语言中的每一个字�W�设定了�l�一�q�且唯一的数字编��P��以满��语言、跨�q�_��q�行文本转换、处理的要求�?/td>	Windows NT/2000/XP�Q�Linux�Q�Java

2D	4E	87	65	31	00	32	00	33	00	00	00	�?�?x86 CPU 中，低字节在�?/font>

�?/td>		�?/td>		1		2		3		\0

	概念描述	举例
字符	��Z��使用的记��P��抽象意义上的一个符受��?/td>	'1', '�?, 'a', '$', '�K?, …�?/td>
字节	计算��Z��存储数据的单元，一�?位的二进制数�Q�是一个很具体的存储空间�?/td>	0x01, 0x45, 0xFA, …�?/td>
ANSI 字符�?/td>	在内存中�Q�如果“字�W�”是�?ANSI �~�码形式存在的，一个字�W�可能��用一个字节或多个字节来表�C�，那么我们�U�这�U�字�W�串�?ANSI 字符�?/b>或�?b>多字节字�W�串�?/td>	"中文123" �Q�占7字节�Q?/font>
UNICODE 字符�?/td>	在内存中�Q�如果“字�W�”是以在 UNICODE 中的序号存在的，那么我们�U�这�U�字�W�串�?UNICODE 字符�?/b>或�?b>宽字节字�W�串�?/td>	L"中文123" �Q�占10字节�Q?/font>

分类	�~�码标准	说明
单字节字�W�编�?/td>	ISO-8859-1	最��单的�~�码规则�Q�每一个字节直接作��Z��?UNICODE 字符。比如，[0xD6, 0xD0] �q�两个字节，通过 iso-8859-1 转化为字�W�串�Ӟ��直接得�?[0x00D6, 0x00D0] 两个 UNICODE 字符�Q�即 "ÖÐ"�?br /> 反之�Q�将 UNICODE 字符串通过 iso-8859-1 转化为字节串�Ӟ��只能正常转化 0~255 范围的字�W��?/td>
ANSI �~�码	GB2312, BIG5, Shift_JIS, ISO-8859-2 …�?/td>	�?UNICODE 字符串通过 ANSI �~�码转化为“字节串”时�Q�根据各自编码的规定�Q�一�?UNICODE 字符可能转化成一个字节或多个字节�?br /> 反之�Q�将字节串�{化成字符串时�Q�也可能多个字节转化成一个字�W�。比如，[0xD6, 0xD0] �q�两个字节，通过 GB2312 转化为字�W�串�Ӟ��得�?[0x4E2D] 一个字�W�，�?'�? 字�?br /> “ANSI �~�码”的特点�Q?br />1. �q�些“ANSI �~�码标准”都只能处理各自语言范围之内�?UNICODE 字符�?br />2. “UNICODE 字符”与“�{换出来的字节”之间的关系是�h��定的�?/td>
UNICODE �~�码	UTF-8, UTF-16, UnicodeBig …�?/td>	与“ANSI �~�码”类似的�Q�把字符串通过 UNICODE �~�码转化成“字节串”时�Q�一�?UNICODE 字符可能转化成一个字节或多个字节�?br /> 与“ANSI �~�码”不同的是： 1. �q�些“UNICODE �~�码”能够处理所有的 UNICODE 字符�?br />2. “UNICODE 字符”与“�{换出来的字节”之间是可以通过计算得到的�?/td>

�c�d��或操�?/b>	C++	Java
字符	wchar_t	char
字节	char	byte
ANSI 字符�?/td>	char[]	byte[]
UNICODE 字符�?/td>	wchar_t[]	String
字节东y��字符�?/td>	mbstowcs(), MultiByteToWideChar()	string = new String(bytes, "encoding")
字符东y��字节�?/td>	wcstombs(), WideCharToMultiByte()	bytes = string.getBytes("encoding")

	对编码的误解
误解一	在将“字节串”�{化成“UNICODE 字符东y��时�Q�比如在��d��文本文�g�Ӟ��或者通过�\|�络传输文本�Ӟ��Ҏ(gu��)��“字节串”简单地作�ؓ单字节字�W�串�Q�采用每“一个字节”就是“一个字�W�”的�Ҏ(gu��)��q�行转化�?br /> 而实际上�Q�在非英文的环境中，应该��“字节串”作�?ANSI 字符�Ԍ��采用适当的编码来得到 UNICODE 字符�Ԍ��有可能“多个字节”才能得到“一个字�W�”�?br /> 通常�Q�一直在英文环境下做开发的�E�序员们�Q�容易有�q�种误解�?/td>
误解�?/td>	�?DOS�Q�Windows 98 �{�非 UNICODE 环境下，字符串都是以 ANSI �~�码的字节�Ş式存在的。这�U�以字节形式存在的字�W�串�Q�必��ȝ��道是哪种�~�码才能被正��地使用。这使我们�Ş成了一个惯性思维�Q�“字�W�串的编码”�?br /> �?UNICODE 被支持后�Q�Java 中的 String 是以字符的“序号”来存储的，不是以“某�U�编码的字节”来存储的，因此已经不存在“字�W�串的编码”这个概念了。只有在“字�W�串”与“字节串”�{化时�Q�或者，��一个“字节串”当成一�?ANSI 字符串时�Q�才有编码的概念�?br /> 不少的�h都有�q�个误解�?/td>

亚洲精品视频在线观看免费,国产精品久久久一区二区,久久久精品蜜桃

�~�写安全的Java代码

radic 发表�?2006-12-15 12:24:05作�?Radic 来源:sun评论�?5 点击�?592 投票��d���?6 投票��M�h��?2关键�?Java;安全�~�码

摘要:

有关MySQL的数据同步备份复刉����?

JAVA EXCEL API

字符�Q�字节和�~�码

引言

1. �~�码问题的由来，相关概念的理�?/h4>

1.1 字符与编码的发展

1.3 字符集与�~�码

2. 字符与编码在�E�序中的实现

3. 几种误解�Q�以及�ؕ码��生的原因和解军_���?/h4>

4. 几种错误理解的纠�?/h4>

用java诅R��写Excel

radic 发表�?2006-12-15 12:24:05
作�?Radic 来源:sun
评论�?5 点击�?592 投票��d��?6 投票��M�h��?2
关键�?Java;安全�~�码

有关MySQL的数据同步备份复刉��?

3. 几种误解�Q�以及�ؕ码��生的原因和解军_��?/h4>