| |||||||||
日 | 一 | 二 | 三 | 四 | 五 | 六 | |||
---|---|---|---|---|---|---|---|---|---|
24 | 25 | 26 | 27 | 28 | 29 | 30 | |||
1 | 2 | 3 | 4 | 5 | 6 | 7 | |||
8 | 9 | 10 | 11 | 12 | 13 | 14 | |||
15 | 16 | 17 | 18 | 19 | 20 | 21 | |||
22 | 23 | 24 | 25 | 26 | 27 | 28 | |||
29 | 30 | 31 | 1 | 2 | 3 | 4 |
平臺:Lucene 2.1.0,JRE 1.4,Oracle 10g,IBM Web Sphere。
數據表:Article。字段:ID(自動增長),Title(String),Content(String)。共有550000條記錄。
對Article建立索引:
1import org.apache.lucene.analysis.*;
2import org.apache.lucene.analysis.cn.*;
3import org.apache.lucene.document.*;
4import org.apache.lucene.index.*;
5import java.sql.*;
6import oracle.jdbc.pool.*;
7
8public class Index
{
9 private String url="jdbc:oracle:thin:@//192.168.0.l:1521/Test";
10 private String user="terry";
11 private String password="dev";
12 private Connection con=null;
13 private Statement st=null;
14 private ResultSet rs=null;
15 private String indexUrl="E:\\ArticleIndex";
16
17 private ResultSet getResult() throws Exception
{
18 OracleDataSource ods=new OracleDataSource();
19
20 ods.setURL(this.url);
21 ods.setUser(this.user);
22 ods.setPassword(this.password);
23
24 this.con=ods.getConnection();
25 this.st=this.con.createStatement();
26 this.rs=this.st.executeQuery("SELECT * FROM Article");
27
28 return this.rs;
29 }
30
31 public void createIndex() throws Exception
{
32 ResultSet rs=this.getResult();
33
34 Analyzer chineseAnalyzer=new ChineseAnalyzer();
35 IndexWriter indexWriter=new IndexWriter(this.indexUrl,chineseAnalyzer,true);
36 indexWriter.setMergeFactor(100);
37 indexWriter.setMaxBufferedDocs(100);
38
39 java.util.Date startDate=new java.util.Date();
40
41 System.out.println("開始索引時間:"+startDate);
42
43 executeIndex(rs,indexWriter);
44
45 indexWriter.optimize();
46
47 indexWriter.close();
48
49 java.util.Date endDate=new java.util.Date();
50
51 System.out.println("索引結束時間:"+endDate);
52 System.out.println("共花費:"+(endDate.getTime()-startDate.getTime())+"ms");
53 }
54
55 private void executeIndex(ResultSet rs,IndexWriter indexWriter) throws Exception
{
56 int i=0;
57
58 while(rs.next())
{
59 int id=rs.getInt("ID");
60 String title=rs.getString("TITLE");
61 String info=rs.getString("CONTENT");
62
63 Document doc=new Document();
64
65 Field idField=new Field("ID",Integer.toString(id),Field.Store.YES,Field.Index.NO,Field.TermVector.NO);
66 Field titleField=new Field("Title",title,Field.Store.YES,Field.Index.TOKENIZED,Field.TermVector.YES);
67 Field infoField=new Field("Content",title,Field.Store.YES,Field.Index.TOKENIZED,Field.TermVector.YES);
68
69 doc.add(idField);
70 doc.add(titleField);
71 doc.add(infoField);
72
73 indexWriter.addDocument(doc);
74
75 i++;
76 }
77
78 this.close();
79
80 System.out.println("共處理記錄:"+i);
81 }
82
83 private void close() throws Exception
{
84 this.rs.close();
85 this.st.close();
86 this.con.close();
87 }
88}
查找:
1import java.io.*;
2import org.apache.lucene.analysis.cn.*;
3import org.apache.lucene.search.*;
4import org.apache.lucene.store.*;
5import org.apache.lucene.document.*;
6import org.apache.lucene.queryParser.QueryParser;
7
8import java.util.*;
9
10public class Search
{
11
12 private static final String indexUrl="E:\\ArticleIndex";
13
14 public static void main(String[] args) throws Exception
{
15/**/ /*建立索引代碼,查找時注釋*/
16 //Index index=new Index();
17
18 //index.createIndex();
19
20
21
22
23 File indexDir=new File(indexUrl);
24 FSDirectory fdir=FSDirectory.getDirectory(indexDir);
25
26 IndexSearcher searcher=new IndexSearcher(fdir);
27
28//對中文建立解析(必須)
29 QueryParser parser=new QueryParser("Title",new ChineseAnalyzer());
30 Query query=parser.parse("李湘");
31
32 Date startDate=new Date();
33 System.out.println("檢索開始時間:"+startDate);
34
35 Hits result=searcher.search(query);
36
37 for(int i=0;i<result.length();i++)
{
38 Document doc=result.doc(i);
39
40 System.out.println("內容:"+doc.get("Content"));
41 }
42
43 Date endDate=new Date();
44
45 System.out.println("共有記錄:"+result.length());
46 System.out.println("共花費:"+(endDate.getTime()-startDate.getTime()));
47 }
48
49}
經測試,建立索引文件大概花了11分鐘。一般情況下,和用SQL執行LIKE查詢差不多。
當然,這只是我的粗略測試。最近一階段,我會對Lucene進行代碼深入研究。
摘要: 搜索流程中的第二步就是構建一個Query。下面就來介紹Query及其構建。 當用戶輸入一個關鍵字,搜索引擎接收到后,并不是立刻就將它放入后臺開始進行關鍵字的檢索,而應當首先對這個關鍵字進行一定的分析和處理,使之成為一種后臺可以理解的形式,只有這樣,才能提高檢索的效率,同時檢索出更加有效的結果。那么,在Lucene中,這種處理,其實就是構建一個Query對象。 就Query對象本身言,它只是Luce... 閱讀全文JDBC TM入門指南
http://www.zebcn.com/html/200411\103.html
Java 程序編碼規范
http://www.zebcn.com/html/200411\104.html
JavaBean入門
http://www.zebcn.com/html/200411\105.html
對JAVA語言的十個常見誤解
http://www.zebcn.com/html/200411\114.html
簡析JAVA的XML編程
http://www.zebcn.com/html/200411\115.html
Java技巧:列表排序
http://www.zebcn.com/html/200411\129.html
Java異常處理
http://www.zebcn.com/html/200411\130.html
Java中初學者比較愛出錯的運算問題
http://www.zebcn.com/html/200411\131.html
類注釋文檔編寫方法
http://www.zebcn.com/html/200411\132.html
對JAVA語言的十個常見誤解
http://www.zebcn.com/html/200411\133.html
簡析JAVA的XML編程(to:初學者們)
http://www.zebcn.com/html/200411\134.html
關于窗口的操作詳談
http://www.zebcn.com/html/200411\135.html
Java 語言中的 return 語句
http://www.zebcn.com/html/200411\136.html
Java連接各種數據庫的實例
http://www.zebcn.com/html/200411\137.html
在Java中實現回調過程
http://www.zebcn.com/html/200411\138.html
Java 中對文件的讀寫操作之比較
http://www.zebcn.com/html/200412\166.html
[原創]Java的文件讀和寫
http://www.zebcn.com/html/200412\167.html
java-在Java中讀寫Excel文件
http://www.zebcn.com/html/200412\171.html
實戰JMS (轉)
http://www.zebcn.com/html/200412\172.html
取得時間的函數
http://www.zebcn.com/html/200412\177.html
JAVA-如何實現TIMER功能
http://www.zebcn.com/html/200412\179.html
數據庫訪問簡單實現
http://www.zebcn.com/html/200412\180.html
將數據庫操作封裝到Javabean
http://www.zebcn.com/html/200412\187.html
用Java編寫掃雷游戲--代碼思想
http://www.zebcn.com/html/200412\190.html
Hibernate事務處理機制
http://www.zebcn.com/html/200412\191.html
jboss 4.0 中JSP調用EJB的簡單例子
http://www.zebcn.com/html/200412\192.html
JSP WEBServer的實現原理
http://www.zebcn.com/html/200412\193.html
Spring 入門(一個簡單的例子)
http://www.zebcn.com/html/200501\204.html
使用Java生成Pdf文檔
http://www.zebcn.com/html/200501\205.html
JAVA生成JPG縮略圖
http://www.zebcn.com/html/200501\206.html
學習J2ME編程需要掌握的七種技術
http://www.zebcn.com/html/200501\210.html
第一個EJB3.0范例
http://www.zebcn.com/html/200502\213.html
Java RMI 簡單示例
http://www.zebcn.com/html/200502\215.html
[原創]java初學者之經驗總結
http://www.zebcn.com/html/200502\217.html
Tomcat配置技巧Top 10
http://www.zebcn.com/html/200502\218.html
學習Java的30個基本概念
http://www.zebcn.com/html/200502\222.html
java常用的加密,解密,數字簽名等API
http://www.zebcn.com/html/200502\227.html
一種簡單的struts級連菜單實現方法
http://www.zebcn.com/html/200502\228.html
2005年4月5日Java新品發布公告
http://www.zebcn.com/html/200504\232.html
Java連接各種數據庫的實例
http://www.zebcn.com/html/200504\241.html
Java常見問題集錦(來自Sun中國官方站)
http://www.zebcn.com/html/200504\243.html
java 文件操作大全
http://www.zebcn.com/html/200504\249.html
J2EE項目危機【翻譯】
http://www.zebcn.com/html/200505\254.html
JAVA對數字證書的常用操作
http://www.zebcn.com/html/200510\275.html
三種整合Struts 應用程序與Spring的方式
http://www.zebcn.com/html/200511\278.html
[分享]Ant簡介
http://www.zebcn.com/html/200511\282.html
Struts 的動態復選框
http://www.zebcn.com/html/200511\289.html
集成 Struts、Tiles 和 JavaServer Faces
http://www.zebcn.com/html/200511\293.html
J2ME應用程序內存優化三招
http://www.zebcn.com/html/200512\338.html
一個生成無重復數字的代碼
http://www.zebcn.com/html/200512\351.html
RSS 開發教程
http://www.zebcn.com/html/200512\355.html
java寫的貪吃蛇游戲
http://www.zebcn.com/html/200512\360.html
應用Java技術開發WAP應用程序
http://www.zebcn.com/html/200512\361.html
web框架Jakarta Tapestry 4.0-rc-3 發布
http://www.zebcn.com/html/200512\366.html
校驗獲取身份證信息的JAVA程序
http://www.zebcn.com/html/200512\368.html
模式實踐:觀察者模式與Spring
http://www.zebcn.com/html/200512\369.html
XML讀寫/存取屬性的Java工具類庫
http://www.zebcn.com/html/200512\370.html
JAVA寫的四則混合運算
http://www.zebcn.com/html/200512\371.html
Web框架RIFE/Laszlo 1.3.1 發布
http://www.zebcn.com/html/200601\372.html
使用 JSF 架構進行設計
http://www.zebcn.com/html/200601\376.html
用java做的滾動的正弦曲線
http://www.zebcn.com/html/200601\378.html
EJB3.0和Spring比較
http://www.zebcn.com/html/200601\379.html
Struts 中常見錯誤
http://www.zebcn.com/html/200601\380.html
漫談Java數據庫存取技術
http://www.zebcn.com/html/200601\381.html
Java多線程程序設計
http://www.zebcn.com/html/200601\385.html
JAVA中的時間操作
http://www.zebcn.com/html/200601\386.html
12個最重要的J2EE最佳實踐
http://www.zebcn.com/html/200601\389.html
Java中的異步網絡編程
http://www.zebcn.com/html/200601\394.html
Java I/O重定向
http://www.zebcn.com/html/200601\395.html
構建高性能J2EE應用的10個技巧
http://www.zebcn.com/html/200601\397.html
java程序得到域名對應的所有IP地址
http://www.zebcn.com/html/200601\398.html
Java語言編程中更新XML文檔的常用方法
http://www.zebcn.com/html/200601\401.html
HTTP代理如何正確處理Cookie
http://www.zebcn.com/html/200601\405.html
作者: fafile 2006-5-18 09:57 回復此發言
JavaMail 發送HTML郵件
http://www.zebcn.com/html/200602\411.html
JSP數據類型
http://www.zebcn.com/html/200602\412.html
Java5 多線程實踐
http://www.zebcn.com/html/200602\415.html
JDK5.0的11個主要新特征
http://www.zebcn.com/html/200602\419.html
運用類反射機制簡化Struts應用程序開發
http://www.zebcn.com/html/200602\420.html
用 Struts 實現動態單選按鈕
http://www.zebcn.com/html/200602\421.html
JDO技術分析及企業應用研究
http://www.zebcn.com/html/200602\422.html
一個J2EE項目的最小工具集
http://www.zebcn.com/html/200602\425.html
一個實現MD5的簡潔的java類
http://www.zebcn.com/html/200602\429.html
服務器與瀏覽器的會話
http://www.zebcn.com/html/200602\434.html
使用Spring JMS簡化異步消息處理
http://www.zebcn.com/html/200603\443.html
采用HttpServlet 實現web文件下載
http://www.zebcn.com/html/200603\444.html
Spring AOP實際應用一例
http://www.zebcn.com/html/200603\445.html
JNI中文處理問題小結
http://www.zebcn.com/html/200603\446.html
java獲取windows系統網卡mac地址
http://www.zebcn.com/html/200603\454.html
Swing vs. SWT 之調用堆棧性能比較
http://www.zebcn.com/html/200603\462.html
Using SVN with Ant
http://www.zebcn.com/html/200603\463.html
mud程序及內附的dom4j解析xml源代碼
http://www.zebcn.com/html/200603\464.html
myeclipse中J2EE項目之間的組織結構
http://www.zebcn.com/html/200603\465.html
初學者如何開發出高質量的J2EE系統
http://www.zebcn.com/html/200603\467.html
WebLogic Server 管理最佳實踐
http://www.zebcn.com/html/200603\474.html
WebLogic Server 性能調優
http://www.zebcn.com/html/200603\475.html
簡化WebLogic 8.1項目的配置
http://www.zebcn.com/html/200603\476.html
WebLogic域配置策略-手動和模板選項
http://www.zebcn.com/html/200603\477.html
JDBC中獲取數據表的信息
http://www.zebcn.com/html/200603\479.html
Java 開發中遇到的亂碼問題
http://www.zebcn.com/html/200603\484.html
簡易的http客戶端附源代碼
http://www.zebcn.com/html/200603\486.html
JDBC 4.0規范之目標
http://www.zebcn.com/html/200603\487.html
java的各種排序算法
http://www.zebcn.com/html/200603\495.html
用Java實現Web服務器
http://www.zebcn.com/html/200603\496.html
使用DBMS存儲過程
http://www.zebcn.com/html/200603\497.html
Java剖析工具YourKit Java Profiler 6.0-EAP1 發布
http://www.zebcn.com/html/200603\3253.html
用Java快速開發Linux GUI應用
http://www.zebcn.com/html/200603\3260.html
java 理論與實踐: 偽 typedef 反模式
http://www.zebcn.com/html/200604\3262.html
使用 Struts Validator (1)
http://www.zebcn.com/html/200604\3263.html
使用 Struts Validator (2)
http://www.zebcn.com/html/200604\3264.html
使用 Struts Validator (3)
http://www.zebcn.com/html/200604\3265.html
使用 Struts Validator (4)
http://www.zebcn.com/html/200604\3266.html
使用 Struts Validator (5)
http://www.zebcn.com/html/200604\3267.html
使用 Struts Validator (6)
http://www.zebcn.com/html/200604\3268.html
查詢數據庫后返回Iterator
http://www.zebcn.com/html/200604\3278.html
DOM屬性用法速查手冊
http://www.zebcn.com/html/200604\3279.html
論J2EE程序員的武功修為
http://www.zebcn.com/html/200604\3280.html
讓window服務進程中自動加載MYSQL服務
http://www.zebcn.com/html/200604\3287.html
J2EE應用程序異常處理框架
http://www.zebcn.com/html/200604\3289.html
Java2下Applet數字簽名具體實現方法
http://www.zebcn.com/html/200604\3290.html
使用tomcat4.1.31和mysql 配置數據源
http://www.zebcn.com/html/200604\3291.html
用java得到本機所有的ip地址
http://www.zebcn.com/html/200604\3292.html
使用Socket連接穿越CMWAP代理
http://www.zebcn.com/html/200604\3293.html
Java讀取Excel方式對比
http://www.zebcn.com/html/200604\3294.html
<p>
<a href='#' onclick='javascript:viewnone(more1)'> 添加附件 </a>
<div id='more1' style='display:none'>
<input type="file" name="attach1" size="50"javascript:viewnone(more2)>
</span>
</div>
<div id='more2' style='display:none'>
<input type="file" name="attach2" size="50"'>
</div>
</p>
js
<SCRIPT language="javascript">
function viewnone(e){
e.style.display=(e.style.display=="none")?"":"none";
}
</script>
方式二:這種方式的動態多文件上傳是實現了的,很簡單的,不說廢話看code
html
<input type="button" name="button" value="添加附件" onclick="addInput()">
<input type="button" name="button" value="刪除附件" onclick="deleteInput()">
<span id="upload"></span>
js
<script type="text/javascript">
var attachname = "attach";
var i=1;
function addInput(){
if(i>0){
var attach = attachname + i ;
if(createInput(attach))
i=i+1;
}
}
function deleteInput(){
if(i>1){
i=i-1;
if(!removeInput())
i=i+1;
}
}
function createInput(nm){
var aElement=document.createElement("input");
aElement.name=nm;
aElement.id=nm;
aElement.type="file";
aElement.size="50";
//aElement.value="thanks";
//aElement.onclick=Function("asdf()");
if(document.getElementById("upload").appendChild(aElement) == null)
return false;
return true;
}
function removeInput(nm){
var aElement = document.getElementById("upload");
if(aElement.removeChild(aElement.lastChild) == null)
return false;
return true;
}
</script>
方式三:動態多文件上傳,只是在oFileInput.click();這個地方,這樣做就不能上傳這個文件了,因為發現它在上傳之時就把這個input中的文件置空了。很可能是為了安全著想吧!
另外還有一點就是說,click()只有在ie中才能正常運行。
雖說這種方式最終沒能實現上傳,但還是留下來參考,看看是否有人可以真正實現上傳。
html
<A href="javascript:newUpload();">添加附件</A>
<TABLE width="100%" border="0" cellpadding="0" cellspacing="1">
<TBODY id="fileList"></TBODY>
</TABLE><DIV id="uploadFiles" style="display:block"></DIV>
js
<SCRIPT language="javascript">
//---新建上傳
function newUpload(){
var oFileList = document.getElementById("fileList");
var fileCount = oFileList.childNodes.length + 1;
var oFileInput = newFileInput("upfile_" + fileCount);
if(selectFile(oFileInput)){
addFile(oFileInput);
}
}
//----選擇文件
function selectFile(oFileInput){
var oUploadFiles = document.getElementById("uploadFiles");
oUploadFiles.appendChild(oFileInput);
oFileInput.focus();
oFileInput.click();//不能這樣做,可能是為了安全著想吧!
var fileValue = oFileInput.value;
if(fileValue == ""){
oUploadFiles.removeChild(oFileInput);
return false;
}
else
return true;
}
//---新建一個文件顯示列表
function addFile(oFileInput){
var oFileList = document.getElementById("fileList");
var fileIndex = oFileList.childNodes.length + 1;
var oTR = document.createElement("TR");
var oTD1 = document.createElement("TD");
var oTD2 = document.createElement("TD");
oTR.setAttribute("id","file_" + fileIndex);
oTR.setAttribute("bgcolor","#FFFFFF");
oTD1.setAttribute("width","6%");
oTD2.setAttribute("width","94%");
oTD2.setAttribute("align","left");
oTD2.innerText = oFileInput.value;
oTD1.innerHTML = '<A href="javascript:removeFile('+ fileIndex + ');">刪除</A>';
oTR.appendChild(oTD1);
oTR.appendChild(oTD2);
oFileList.appendChild(oTR);
}
//---移除上傳的文件
function removeFile(fileIndex){
var oFileInput = document.getElementById("upfile_" + fileIndex);
var oTR = document.getElementById("file_" + fileIndex);
uploadFiles.removeChild(oFileInput);
fileList.removeChild(oTR);
}
//---創建一個file input對象并返回
function newFileInput(_name){
var oFileInput = document.createElement("INPUT");
oFileInput.type = "file";
oFileInput.id = _name;
oFileInput.name = _name;
oFileInput.size="50";
//oFileInput.setAttribute("id",_name);
//oFileInput.setAttribute("name",_name);
//oFileInput.outerHTML = '<INPUT type=file id=' + _name + ' name=' + _name + '>';
//alert(oFileInput.outerHTML);
return oFileInput;
}
</SCRIPT>
posted on 2007-01-26 17:21 重歸本壘(BNBN) 閱讀(1656) 評論(4) 編輯 收藏 引用 所屬分類: JS
呵呵,我的方法不知道和你的三種方法有沒有可比性,個人感覺還不錯! @施偉 施偉 的做法,是不是還是不能解決,先選擇了一個文件,提交服務器之后這個file input域的值又被自動清空的問題? 回復 更多評論 評論
# re: 幾種js實現的動態多文件上傳 2007-01-27 13:20 施偉
做一個 添加附件 然后做一個type為file的input框,把此框和span定位重疊起來 把file框透明度設置為0 即完全看不到,但是確實存在。這個時候點span的時候就是在點這個file框 但是看不到file框子 是不是實現了呢? 然后再結合你第二種的方式給框編號 動態增加就可以實現多文件上傳了 。
呵呵 我在我的程序里面這樣實現的 很好用 如果有興趣討論到我blog留言 或者發郵件給我吧 多交流。。。
回復 更多評論 # re: 幾種js實現的動態多文件上傳 2007-01-29 18:00 重歸本壘(BNBN)
呵呵!施偉,你這樣做,如果實現了,那么比我的方法更勝一籌了,我以前也這樣考慮過,只是覺的好麻煩,而沒有去實現它!
另外,還非常謝謝你能關注我的Bolg!
回復 更多評論 # re: 幾種js實現的動態多文件上傳 2007-02-12 17:12 路過的
# re: 幾種js實現的動態多文件上傳 2007-06-04 11:28 sangern
[ 2007-7-27 16:28:00 | By: 葉尋飛 ]
初學JSP時,寫了一些工具函數因為不太會用JAVA下的正則表達式也只能這么寫啦!
發出來讓大家批評批評提點意見!有幾個函數不算是自己寫的希望愛挑剌的朋友嘴
下留情!我是新手我怕誰,臉皮不行的人水平也上不去呀.嘻嘻..
package mxzc.web.strctrl;
public class StringCtrl
{/********************************************
public synchronized String HTMLcode(String TXTcode) 功能:文本替換
public synchronized String Unhtmlcode(String str) 功能:(不完全)反文本
替換
public synchronized String Unhtmlcodea(String str) 功能:反文本替換
public synchronized boolean emailcheck (String email) 功能:檢查一個字
符串是否符合E-Mail
public synchronized boolean isemailstr(String email) 功能:檢查一個字
符串是否符合E-Mail
public synchronized boolean isqqstr(String qq) 功能:檢查一個字符串是
否符合QQ
public synchronized boolean isnumstr(String num) 功能:檢查一個字符串
是否為一數字串
public synchronized String userstrlow(String user) 功能:替換用戶名中
不合法的部分
public synchronized boolean userstrchk(String user) 功能:檢查字符串是
否符合用戶名法則
public synchronized boolean istelstr(String tel) 功能:檢查字符串是否
為TEL
public synchronized boolean urlcheck(String url) 功能:檢查字符串是否
為URL
public synchronized String isotogbk(String iso) 功能:ISO9006-1碼轉換
為GBK
public synchronized String gbktoiso(String gbk) 功能:GBK碼轉換為
ISO9006-1
public synchronized String dostrcut(String oldstr,int length) 功能:按
漢字長換行(英文按半個字長)
public synchronized String inttodateshow(int datenum) 功能:將1900年至
時間的秒數換為日期字符串
public synchronized String nowdateshow() 功能:顯示當前日期
public synchronized java.util.Date inttodate(int datenum) 功能:將秒數
轉換為日期
public synchronized int datetoint() 功能:將時間換為從1900年至今的秒
數
public synchronized int datetoint(java.util.Date d) 功能:將時間換為從
1900年至時間的秒數
public synchronized String overlengthcut(String str,int length) 功能:
截取前幾個字符,單位為漢字字長
public synchronized String replace(String str,String suba,String subb)
功能:字符串替換
*********************************************/
private static final String isostr="ISO8859-1";
private static final String gbkstr="GBK";
public StringCtrl()
{
}
public synchronized boolean emailcheck (String email)
{
if(email==null)return false;
if(email.length()<6)return false;
if(email.indexOf("@")<2)return false;
if(email.indexOf(".")<4)return false;
if(email.endsWith(".")||email.endsWith("@"))return false;
if(email.lastIndexOf("@")>email.lastIndexOf(".")-1)return false;
if(email.lastIndexOf("@")!=email.indexOf("@"))return false;
String[] lowstr={"\@#","\"","\n","&","\t","\r","<",">","/","\\","#"};
for(int i=0;i<lowstr.length;i++)if(email.indexOf("lowstr")>0)return
false;
return true;
}
public synchronized boolean isemailstr(String email)
{
if(email==null)return false;
if(email.indexOf("@")==-1||email.indexOf(".")==-1||email.length()<6)
return false;
return true;
}
public synchronized boolean isqqstr(String qq)
{
if(qq==null)return false;
if(qq.length()>12)return false;
if(qq.length()<5)return false;
for(int i=0;i<qq.length();i++)
if(!(((int)qq.charAt(i))<=57&&((int)qq.charAt(i))>=48))return false;
return true;
}
public synchronized boolean isnumstr(String num)
{
if(num==null)return false;
if(num.length()<1)return false;
for(int i=0;i<num.length();i++)
if(!(((int)num.charAt(i))<=57&&((int)num.charAt(i))>=48))return false;
return true;
}
public synchronized String userstrlow(String user)
{
String newuserstr=user.trim();
char[] lowstr=
{@#\@#@#,@#\"@#,@#\n@#,@#&@#,@#\t@#,@#\r@#,@#<@#,@#>@#,@#/@#,@#\\@#,@##
@#};
for(int i=0;i<lowstr.length;i++)
newuserstr=newuserstr.replace(lowstr[i],@#+@#);
return newuserstr;
}
public synchronized boolean userstrchk(String user)
{
String newuserstr=user.trim();
char[] lowstr=
{@#\@#@#,@#\"@#,@#\n@#,@#&@#,@#\t@#,@#\r@#,@#<@#,@#>@#,@#/@#,@#\\@#,@##
@#,@#~@#,@#`@#,@#!@#,@#@@#,@#$@#,@#%@#,@#^@#,@#*@#,@#(@#,@#)@#,@#-
@#,@#_@#,@#+@#,@#=@#,@#|@#,@#?@#,@#,@#,@#;@#,@#.@#};
for(int i=0;i<lowstr.length;i++)
newuserstr=newuserstr.replace(lowstr[i],@#+@#);
return (user.equals(newuserstr))?true:false;
}
public synchronized boolean istelstr(String tel)
{
if(tel==null)return false;
if(tel.length()<1)return false;
if(tel.length()>32)return false;
for(int i=0;i<tel.length();i++)
if(!(((int)tel.charAt(i))<=57&&((int)tel.charAt(i))>=48))if(tel.charAt
(i)!=@#-@#)return false;
return true;
}
public synchronized boolean urlcheck(String url)
{
if(url==null)return false;
if(url.length()<10)return false;
String urls=url.toLowerCase();
if(!urls.startsWith("http://"))return false;
if(url.indexOf("<")>0||url.indexOf(">")>0)return false;
return true;
}
public synchronized String isotogbk(String iso)throws Exception
{
if(iso!=null)return (new String(iso.getBytes(isostr),gbkstr));
if(iso.length()<1)return "";
return null;
}
public synchronized String gbktoiso(String gbk)throws Exception
{
if(gbk!=null)return (new String(gbk.getBytes(gbkstr),isostr));
if(gbk.length()<1)return "";
return null;
}
public synchronized String HTMLcode(String TXTcode)
{
String newstr="";
if(TXTcode==null)return "";
newstr=TXTcode;
newstr=replace(newstr,"&","&");
newstr=replace(newstr,"\"",""");
newstr=replace(newstr," "," ");
newstr=replace(newstr,"<","<");
newstr=replace(newstr,">",">");
newstr=replace(newstr,"\@#","'");
return newstr;
}
public synchronized String Unhtmlcode(String str)
{
String newstr="";
if(str==null)return "";
if(str.length()<1)return "";
newstr=str;
newstr=replace(newstr,"&","&");
//newstr=replace(newstr,""","\"");
newstr=replace(newstr," "," ");
newstr=replace(newstr,""","\"");
//newstr=replace(newstr,"<","<");
//newstr=replace(newstr,">",">");
newstr=replace(newstr,"'","\@#");
return newstr;
}
public synchronized String Unhtmlcodea(String str)
{
String newstr="";
if(str==null)return "";
if(str.length()<1)return "";
newstr=str;
newstr=replace(newstr,"&","&");
newstr=replace(newstr,""","\"");
newstr=replace(newstr," "," ");
newstr=replace(newstr,"<","<");
newstr=replace(newstr,">",">");
newstr=replace(newstr,"'","\@#");
return newstr;
}
public synchronized String dostrcut(String oldstr,int length)
{
int i=0;
int j=0;
int k=0;
String newstr="";
if(oldstr==null)return "";
if(length<=0)return "";
for(i=0;i<oldstr.length();i++)
{
if(oldstr.charAt(i)==@#\n@#)j=0;
else if(((int)(oldstr.charAt(i)))>255)j+=2;
else j++;
if((j/2)>=length)
{
newstr=newstr.concat(oldstr.substring(k,i)+"\n");
k=i;
j=0;
}
}
newstr=newstr.concat(oldstr.substring(k)+"\n");
return newstr;
}
public synchronized String inttodateshow(int datenum)
{
int year=0;
int month=0;
int day=0;
int hour=0;
int minute=0;
int second=0;
String datestr="";
java.util.Date d;
d=new java.util.Date((long)(datenum)*1000);
java.util.Calendar ds=java.util.Calendar.getInstance();
ds.setTime(d);
year=ds.get(java.util.Calendar.YEAR);
month=ds.get(java.util.Calendar.MONTH);
day=ds.get(java.util.Calendar.DATE);
hour=ds.get(java.util.Calendar.HOUR_OF_DAY);
minute=ds.get(java.util.Calendar.MINUTE);
second=ds.get(java.util.Calendar.SECOND);
datestr=Integer.toString(year)+"/"+Integer.toString(1+month)
+"/"+Integer.toString(day);
return datestr;
}
public synchronized String nowdateshow()
{
int year=0;
int month=0;
int day=0;
int hour=0;
int minute=0;
int second=0;
String datestr="";
java.util.Calendar ds=java.util.Calendar.getInstance();
year=ds.get(java.util.Calendar.YEAR);
month=ds.get(java.util.Calendar.MONTH);
day=ds.get(java.util.Calendar.DATE);
hour=ds.get(java.util.Calendar.HOUR_OF_DAY);
minute=ds.get(java.util.Calendar.MINUTE);
second=ds.get(java.util.Calendar.SECOND);
datestr=Integer.toString(year)+"/"+Integer.toString(1+month)
+"/"+Integer.toString(day);
return datestr;
}
public synchronized java.util.Date inttodate(int datenum)
{
int year=0;
int month=0;
int day=0;
String datestr="";
java.util.Date d;
d=new java.util.Date((long)(datenum)*1000);
return d;
}
public synchronized int datetoint()
{
java.util.Date d=null;
long ds=0;
d=new java.util.Date();
ds=d.getTime();
return (int)(ds/1000);
}
public synchronized int datetoint(java.util.Date d)
{
long ds=0;
ds=d.getTime();
return (int)(ds/1000);
}
public synchronized String overlengthcut(String str,int length)
{
int i=0;
int j=0;
if(str==null)return "";
if(length<0)return "";
if(str.length()<=length)return str;
for(i=0;i<str.length();i++)
{
if(((int)(str.charAt(i)))>255)j+=2;
else j++;
if((j/2)>=length)
{
return str.substring(0,i);
}
}
return str;
}
public synchronized String replace(String str,String suba,String subb)
{
String newstr="";
int start=0;
int offset=0;
int subalength=0;
int strlength=0;
if(str==null||suba==null||subb==null)return str;
if(suba.equals(subb))return str;
if(str.length()<suba.length()||str.length()<subb.length())return str;
if(str.length()>0&&suba.length()>0&&subb.length()>0)
{
subalength=suba.length();
strlength=str.length();
while(true)
{
if(str.indexOf(suba)<0)break;
if(offset>strlength)break;
start=str.indexOf(suba,offset);
if(start<offset)break;
newstr=newstr.concat(str.substring(offset,start));
newstr=newstr.concat(subb);
offset=start+subalength;
}
newstr=newstr.concat(str.substring(offset));
return newstr;
}
else
{
return str;
}
}
}
在Java編程中,中文字體編碼難倒了不少程序員,如果抓住了影響Java中文顯示的幾個關鍵因素,問題將迎刃而解。
Java是目前最流行的面向對象的編程語言之一,Java支持UTF-8、ISO-8
859-1、GBK等各種字體編碼,可筆者發現Java中字體編碼的問題仍難倒了不少程序員,網上雖然也有不少關于在Java中如何正確顯示中文的文章,但都不夠全面,筆者特意總結如下。
影響Java中字體編碼正確顯示的有幾個因素: 1)數據庫的連接方式; 2)網頁中使用的字體編碼; 3)數據庫里存放數據的字體編碼; 4)Java的缺省字體編碼。如果在編程中遇到不能正確顯示中文時,要先弄清楚以上幾項所使用的字體編碼,再分析找出原因,即可解決問題。
眾所周知,JSP是Java的一種,和網頁有關,而網頁也有自己的中文編碼系統,所以JSP處理中文要比純Java的類文件更為麻煩。本文的測試數據庫是MySQL3.2,數據庫連接驅動是用org.gjt.mm.mysql.Driver,這里主要討論UTF-8和GBK的顯示( GB2312是GBK的一個子集,Java中可以使用GBK來代替GB系列)。我們先來研究JSP中字體編碼問題, 下面第一到第六點是針對JSP的(因為從數據庫里讀出中文數據與寫入中文數據有所區別,咱們分別說明,前三點是從讀取數據庫到顯示在網頁,后三點是從網頁輸入數據到存入數據庫),第七到第九點針對純Java的類文件。 以下rs表示ResultSet的一個實例,是執行Select語句之后產生的數據集。
一、數據庫連接方式使用UTF-8
在連接數據庫的驅動后面加上這句參數useUnicode=true&characterEncoding=
UTF-8,例如jdbc:mysql://localhost/DBVF?autoReconnect=true&useUnicode=
true&characterEncoding=UTF-8,從數據庫里讀出中文顯示在使用GBK的JSP的網頁里,如果數據庫里存放的字體編碼是UTF-8,在JSP中使用 str=new String(rs.getBytes(1),"UTF-8")或者str=rs.getString(1),可以正確顯示中文。如果數據庫里存放的是GBK數據,那么JSP中也要使用str=new String(rs.getBytes(1),"GBK")來顯示正確的中文。值得注意的是如果頁面使用UTF-8,數據庫里存放的是UTF-8,也可以用str=new String(rs.getBytes(1),"GBK")正確顯示中文。如果網頁是UTF-8,而數據庫里存放的是GBK,無法直接顯示中文,需要2步轉換, str=new String(rs.getBytes(1),"GBK"); 再str=new String(str.getBytes("UTF-8"),"GBK"),才可以正確顯示中文。
二、數據庫連接方式使用GBK
在連接數據庫的驅動后面加上這句參數useUnicode=true&characterEncoding=
GBK,例如jdbc:mysql://localhost/DBVF?autoReconnect=true&UseUnicode=true&
characterEncoding=GBK,從數據庫里讀出中文,顯示在使用GBK的JSP的網頁里,如果數據庫里存放的字體編碼是UTF-8,在JSP中一定要使用 str=new String(rs.getBytes(1),"UTF-8"),才正確顯示中文。如果數據庫里存放的是GBK數據,那么JSP中也要使用str=new String(rs.getBytes(1),"GBK") 或者直接使用str=rs.getString(1),即可顯示正確的中文。 如果網頁是UTF-8,而數據庫里存放的是GBK,只能用str=new String(rs.getString(1).getBytes("UTF-8"),"GBK")的方法來顯示中文; 如果網頁是UTF-8,而數據庫里存放的是UTF-8,可用str=new String(rs.getBytes(1),"GBK") 或者rs.getString(1)方法來顯示中文。
三、使用缺省數據庫連接方式
連接數據庫的驅動后面沒有這句參數useUnicode=&characterEncoding=,例如jdbc:mysql://localhost/DBVF?autoReconnect=true,沒有參數useUnicode=true&characterEncoding,表示使用默認的ISO-8895-1編碼。
1. 從數據庫里讀出中文,顯示在GBK的網頁里。如果數據庫里存放的字體編碼是UTF-8,在JSP網頁中一定要使用語句 str=new String(rs.getBytes(1),"UTF-8") 或者str= new String(rs.getString(1).getBytes("ISO-8859-1"),"UTF-8"),才可正確顯示中文。如果數據庫里存放的是GBK數據,那么JSP中也要使用str=new String(rs.getBytes(1),"GBK")或str=new String(rs.getString(1).getBytes("ISO-8859-1"),"GBK") 顯示正確的中文。
2. 如果網頁是UTF-8,不能直接正確顯示GBK,需要2步轉換,str=new String(rs.getBytes(1),"GBK"),再str=new String(str.getBytes("UTF-8"),"GBK") 才可以正確顯示中文。如果數據庫里存的是UTF-8,直接用str=new String(rs.getBytes(1),"GBK")或者str=new String(rs.getString(1).getBytes("ISO-8859-1"),"GBK")就可以顯示中文了。
以上是讀取數據庫里中文正確顯示在網頁上,下面三點是如何正確存入數據庫。
四、數據庫連接方式使用UTF-8編碼
JSP中要把網頁輸入的中文存入數據庫,通常有一個提交(Submit)的過程,是用str=request.getParameter("username"),然后執行update或者insert語句來存入數據庫。如何賦值給str很重要,而且這里中文輸入與網頁所使用的字體編碼有關。
1、 網頁使用UTF-8,使用str= new String(request.getParameter("username").getBytes("ISO-8859-1"),"UTF-8")或者str= new String(request.getParameter("username").getBytes(),"UTF-8"),都可以使得存到數據庫里的數據是UTF-8編碼。
2. 網頁使用GBK,使用str= new String(request.getParameter("username").getBytes(),"GBK"),那么存入數據庫的是UTF-8編碼。
3. 值得注意的是使用UTF-8的數據庫連接方式不能存得GBK。
五、數據庫連接方式使用GBK編碼
1. 輸入使用GBK網頁,存到數據庫里是GBK的方法: str= new String(request.getParameter("username").getBytes("ISO-8859-1"),"GBK") 或者str= new String(request.getParameter("username").getBytes(),"GBK")。
2. 網頁使用GBK,想存入UTF-8到數據庫里,要分2步: 先str=new String(request.getParameter("username").getBytes(),"GBK"),再str=new String(str.getBytes("UTF-8"),"GBK")即可。
3. 網頁使用UTF-8,而且使用str= new String(request.getParameter("username").getBytes("ISO-8859-1"),"GBK") 或者str= new String(request.getParameter("username").getBytes(),"UTF-8"),那么存到數據庫里的數據是UTF-8編碼。
4. 網頁使用UTF-8,而且使用str= new String(request.getParameter("username").getBytes("ISO-8859-1"),"UTF-8"),那么存到數據庫里的數據是GBK編碼。
六、數據庫連接方式使用缺省,即不使用參數useUnicode和characterEncoding
1. 網頁使用GBK,如果使用str= request.getParameter("username")或者str= new String(request.getParameter("username").getBytes()),那么在數據庫里的數據是GBK碼。網頁使用UTF-8 和使用str= request.getParameter("username"),則存入數據庫是UTF-8編碼。
2. 如果使用str= new String(request.getParameter("username").getBytes("ISO-8859-1")),那么根據網頁提供的字體編碼而存到數據庫里,比如是UTF-8的網頁,那么存到數據庫中就是UTF-8編碼,如果使用GBK網頁,那么存到數據庫里的字就是GBK編碼。
3. 如果使用str= new String(request.getParameter("username").getBytes("UTF-8"),"UTF-8")這一種組合能存到正確的數據外,其他存到數據庫里的數據則都是亂碼或者錯誤碼。在這個UTF-8組合的特例中,網頁使用的是GBK,則存放到數據庫里就是GBK,網頁使用UTF-8,那么存到數據庫里的就是UTF-8。
4. 網頁是GBK的要存得UTF-8,一定需要2步: company=new String(request.getParameter("company").getBytes(),"GBK")和company=new String(company.getBytes("UTF-8"))。
5. 網頁是UTF-8的,不能存得GBK在數據庫里,一句話,改變數據庫連接方式不能存得GBK碼。
以上所有的都是基于JSP網頁和數據庫交換數據,下面討論一下純JAVA編程下的字體編碼轉換。
七、數據庫連接方式使用UTF-8編碼
1. 數據庫里的中文是UTF-8,可以轉換為GBK,但不能把GBK存入數據庫。
2. 數據庫是GBK,如果轉換為UTF-8,使用content=new String(rs.getBytes(2),"GBK")直接將content存入數據庫就可為UTF-8。
八、數據庫連接方式使用GBK編碼
1. 數據庫里的中文是UTF-8,如果轉換為GBK,使用content= new String(rs.getString(2).getBytes(),"UTF-8"),再直接使用update或者insert語句插入到數據庫,即存得GBK。如果使用content= new String(rs.getString(2).getBytes(),"GBK")或者content= new String(rs.getString(2).getBytes()),再存入數據庫即存得還是UTF-8編碼。
2. 數據庫里的中文是GBK,如果轉換為UTF-8,使用content= new String(rs.getString(2).getBytes("UTF-8"))或者content= new String(rs.getString(2).getBytes("UTF-8"),"GBK"),再直接使用update或者insert語句插入到數據庫,即存得UTF-8。
3. 如果某個String是GBK,要轉換為UTF-8,也是使用content= new String(GBKstr.getBytes("UTF-8"))或者content= new String(GBKstr.getBytes("UTF-8"),"GBK"); 如果某個String是UTF-8,要轉換為GBK,應該使用new String(UTFstr.getBytes("GBK"),"UTF-8")。
九、數據庫連接方式使用缺省,即不跟參數
1. str2=new String(GBKstr.getBytes("UTF-8"),"ISO-8859-1"),可以將數據庫里的GBK編碼轉換為UTF-8。
2. 讀取UTF-8然后存入UTF-8,則用str1=new String(UTFstr.getBytes(),"ISO-8859-1")或者str1=new String(UTFstr.getBytes("GBK"),"ISO-8859-1")。
3. 不能實現數據庫里的UTF-8轉換為GBK。
如果采用UTF-8的數據庫連接方式或者缺省數據連接方式,那么無法將UTF-8轉為GBK;而GBK的數據庫連接方式可以實現UTF-8和GBK的相互轉換。建議大家采用GBK的數據連接方式。
第三步:對動態輸出內容編碼
每一個ISO-8859-1字符集中的字符都可以編碼為一個數值,完整的對應關系請見下面的幾個表:
數 值
編碼表示法
含 義
表現形式
�-
-
Unused
-
-
HorizontalTab
space
-
Linefeed
space
-
-
Unused
-
-
Space
space
!
-
Exclamationmark
!
"
"
Quotationmark
"
#
-
Numbersign
#
$
-
Dollarsign
$
%
-
Percentsign
%
&
&
Ampersand
&
'
-
Apostrophe
'
(
-
Leftparenthesis
(
)
-
Rightparenthesis
)
*
-
Asterisk
*
+
-
Plussign
+
,
-
Comma
,
-
-
Hyphen
-
.
-
Period(fullstop)
.
/
-
Solidus(slash)
/
0-9
-
Digits(0-9)
0-9
:
-
Colon
:
;
-
Semi-colon
;
<
<
Lessthan
<
=
-
Equalssign
=
>
>
Greaterthan
>
?
-
Questionmark
?
@
-
Commercialat
@
A-Z
-
UppercaseA-Z
A-Z
[
-
Leftsquarebracket
[
\
-
Reversesolidus(backslash)
\
]
-
Rightsquarebracket
]
^
-
Caret
^
_
-
Horizontalbar
_
`
-
Acuteaccent
`
a-z
-
Lowercasea-z
a-z
{
-
Leftcurlybrace
{
|
-
Verticalbar
|
}
-
Rightcurlybrace
}
~
-
Tilde
~
-?
-
Unused
-
Non-breakingspace
?
?
Invertedexclamation
?
¢
¢
Centsign
¢
£
£
Poundsterlingsign
£
¤
¤
Generalcurrencysign
¤
¥
¥
Yensign
¥
&brVBar;
|
Brokenverticalbar
|
§
§
Sectionsign
§
¨
¨
UMLaut(dierisis)
¨
?
?
Copyright
?
a
a
Feminineordinal
a
?
?
Leftanglequote,guillemotleft
?
?
?
Notsign
?
Softhyphen
?
?
ReGISteredtrademark
?
ˉ
ˉ
Macronaccent
ˉ
°
°
Degreesign
°
±
±
Plusorminus
±
2
2
Superscripttwo
2
3
3
Superscriptthree
3
′
′
Acuteaccent
′
μ
μ
Microsign
μ
?
?
Paragraphsign
?
·
·
Middledot
·
?
?
Cedilla
?
1
1
Superscriptone
1
o
o
Masculineordinal
o
?
?
Rightanglequote,guillemotright
?
?
?
Fraction(onequarter)
?
?
?
Fraction(onehalf)
?
?
?
Fraction(threequarters)
?
?
?
Invertedquestionmark
?
à
à
CapitalA,graveaccent
à
á
á
CapitalA,acuteaccent
á
?
?
CapitalA,circumflexaccent
?
?
?
CapitalA,tilde
?
?
?
CapitalA,umlaut(dierisis)
?
?
?
CapitalA,ring
?
?
?
CapitalAEdipthong(ligature)
?
?
?
CapitalC,cedilla
?
è
è
CapitalE,graveaccent
è
é
é
CapitaE,acuteaccent
é
ê
ê
CapitalE,circumflexaccent
ê
&EUML;
?
CapitalE,umlaut(dierisis)
?
ì
ì
CapitalI,graveaccent
ì
í
í
CapitalI,acuteaccent
í
?
?
CapitalI,circumflexaccent
?
?
?
CapitalI,umlaut(dierisis)
?
D
D
CapitalEth,Icelandic
D
?
?
CapitalN,tilde
?
ò
ò
CapitalO,graveaccent
ò
ó
ó
CapitalO,acuteaccent
ó
?
?
CapitalO,circumflexaccent
?
?
?
CapitalO,tilde
?
?
?
CapitalO,umlaut(dierisis)
?
×
×
Multiplysign
×
?
?
CapitalO,slash
?
ù
ù
CapitalU,graveaccent
ù
ú
ú
CapitalU,acuteaccent
ú
?
?
CapitalU,circumflexaccent
?
ü
ü
CapitalU,umlaut(dierisis)
ü
Y
Y
CapitalY,acuteaccent
Y
T
T
CapitalThorn,Icelandic
T
?
?
Smallsharps,German(szligature)
?
à
à
Smalla,graveaccent
à
á
á
Smalla,acuteaccent
á
a
a
Smalla,circumflexaccent
a
?
?
Smalla,tilde
?
&aUML;
?
Smalla,umlaut(dierisis)
?
?
?
Smalla,ring
?
?
?
Smallaedipthong(ligature)
?
?
?
Smallc,cedilla
?
è
è
Smalle,graveaccent
è
é
é
Smalle,acuteaccent
é
ê
ê
Smalle,circumflexaccent
ê
?
?
Smalle,umlaut(dierisis)
?
ì
ì
Smalli,graveaccent
ì
í
í
Smalli,acuteaccent
í
?
?
Smalli,circumflexaccent
?
?
?
Smalli,umlaut(dierisis)
?
e
e
Smalleth,Icelandic
e
?
?
Smalln,tilde
?
ò
ò
Smallo,graveaccent
òò
ó
ó
Smallo,acuteaccent
ó
?
?
Smallo,circumflexaccent
?
?
?
Smallo,tilde
?
?
?
Smallo,umlaut(dierisis)
?
÷
÷
Divisionsign
÷
?
?
Smallo,slash
?
ù
ù
Smallu,graveaccent
ù
ú
ú
Smallu,acuteaccent
ú
?
?
Smallu,circumflexaccent
?
ü
ü
Smallu,umlaut(dierisis)
ü
y
y
Smally,acuteaccent
y
t
t
Smallthorn,Icelandic
t
?
?
Smally,umlaut(dierisis)
?
根據上表,我們來看2個應用實例:
? 2000 Some Co., Inc.:用?表示版權標識信息。
? 2000 Some Co., Inc.:用?同樣標識版權標識信息。
對不被信任的數據進行編碼要優于過濾不被信任的數據。在客戶端瀏覽器需要顯示一些特殊字符的情況下,這種處理方式會恢復特殊字符的廬山真面目。當然,對所有不被信任的數據進行編碼,是個相當耗費資源的工作。根據需要,Web開發者可以在編碼和過濾2種方法中進行權衡,選擇一種或者混合使用。
該文章轉載自1024k:http://www.1024k.cn/web/2007/200701/15407.html
第二步:鑒別特殊的字符
什么是特殊字符?HTML定義如下:特殊字符就是那些能夠影響頁面顯示效果的字符。依據上下文的不同,特殊字符也會有所不同。下面我們來分類看看:
● 在塊級別元素所包含的內容中應考慮的特殊字符有:
<:引入一個標記
&:引入一個字符實體
>:結束一個標記
● 在屬性值中應考慮的特殊字符有:
":在以雙引號包裹屬性值的情況下,"標記了屬性值的結尾。
':在以單引號包裹屬性值的情況下,'標記了屬性值的結尾。
空白字符:在屬性值沒有被任何引號包裹的情況下,空白字符標記了屬性值的結尾,比如空格、tab。
&:當需要在屬性值中引入字符實體時,就需要使用&。
● 搜索引擎系統會在搜索結果頁面中包含一個再次運行搜索的鏈接,這個鏈接中會包含編碼過的搜索查詢字符串。這種情況下應考慮的特殊字符有:
空格、tab以及換行符:它們標記了URL的結尾。
&:它標記一個字符實體,或者一個獨立的CGI參數。
非ASCII字符:就是ISO-8859-1編碼中ASCII碼大于128的字符,它們不允許在URL中使用。
%:無論服務器對由escape編碼的HTTP參數如何解碼,都必須過濾出字符%。
● 在 之間的內容中應考慮的特殊字符有:分號,圓括號,大括號以及換行符。
● 在服務器端腳本中應考慮的特殊字符有:!
● 其他情況下應考慮的特殊字符有:=。但注意,現有的攻擊事件還沒有利用過這個字符,但作為一個全面考慮,這里還是列出來。
另外,我們還要重視一種情況:其他附加字符也可能包含在特殊字符列表中。總之,Web開發者必須對應用程序的輸入內容進行檢查,以確定哪些字符會影響程序的執行。
該文章轉載自1024k:http://www.1024k.cn/web/2007/200701/15408.html
在各種Internet攻擊行為中,通過Web方式侵入系統造成信息泄漏、數據丟失的事件非常普遍。例如,攻擊者在頁面表單中輸入惡意內容,繞過輸入檢查,攻擊系統。為此,Web開發者應采取有效的措施從信息采集的入口處堵截惡意內容的進入。本文將對這方面的問題進行分析,并提供幾種應對方法。
問題分析
Web頁面包含文本和HTML標記,它們由服務器建立,被客戶端解釋。HTML標記一般被服務器特殊對待。例如,“<”一般指示一個HTML標記的開始,“<P>”可以影響頁面的顯示格式,<Script>可以將腳本代碼引入瀏覽器而執行。
對于靜態頁面,服務器可以完全控制它在客戶端如何解釋。但是對于動態頁面,服務器就不可能完全控制它在客戶端的解釋行為了。這樣就產生了問題:如果動態頁面中包含了不可信的內容,那么無論是服務器端還是客戶端,就不能保證是否會發生安全問題。
現在,幾乎所有的商用Web服務器就會建立動態頁面。最典型的一個例子就是我們經常要使用的搜索引擎,它接受用戶的查詢內容后,搜索數據庫,然后將動態內容寫入一個頁面模板,最后顯示給用戶包含搜索結果的頁面。這種情況下,檢查動態內容是否包含了特殊字符就非常重要,例如“<”。如果包含了特殊字符,用戶端的瀏覽器就可能將之誤解為HTML標記或者引入執行程序,而不是當做文本信息顯示出來。危險也就產生于此!如果不對動態頁面進行特殊字符的檢查,那么攻擊者就有可能在交互頁面的輸入表單中寫入些特殊字符串,從而導致輸出頁面執行非法行為。這種例子很多,比如我們編寫一個留言簿,卻不對輸入內容進行特殊字符的校驗,那么攻擊者就有可能填寫特殊字符,最終導致留言簿頁面的非正常工作,例如填寫一段惡意代碼:死循環JavaScript腳本、重復打開窗口的JavaScript腳本。
應對措施分析
通常,不被信任的內容主要來自以下幾個方面:URL參數,表單輸入元素,Cookies和數據庫查詢。要減輕這些方面可能導致的攻擊,建議采取如下的步驟:
1、為每個由服務器產生的Web頁面明確地設置字符集編碼
2、鑒別特殊的字符
3、對動態輸出內容編碼
4、過濾動態輸出內容中的特殊字符
5、檢查cookies 值
以下詳細分析這5個步驟。
第一步:明確地設置字符集編碼
字符集編碼就是頁面的字符編碼體系,在瀏覽器中可以通過“查看/編碼”來轉換:
很多Web頁面都省略了字符集編碼設置,也就是說在頁面源代碼頭部HTTP一節中沒有定義charset參數。早期的HTML版本中,如果沒有定義charset參數,字符集編碼就默認為ISO-8859-1。但實際上,許多瀏覽器都有各自的默認字符集編碼。因此,HTML版本4規定,如果沒有指定charset參數,任何可能的字符集編碼都可以使用,這就依賴于用戶的瀏覽器種類了。
如果Web服務器不能指定使用哪個字符集編碼,那么它就不能區分出特殊字符。沒有指定字符集編碼的Web頁面之所以可以在大多數時間中工作良好,這是因為在大多數的字符集編碼類別中,同一字符對應一個小于128的字節值。對于大于128的特殊字符,例如“<”,將采用16位字符編碼方案處理。一些瀏覽器能夠識別并執行這種編碼方案,但同時,攻擊者也可能據此使用惡意腳本,使防范難度加大,因為服務器可能完全不能了解哪個字節代表哪個特殊字符。例如,字符集UTF-7為“<”和“>”提供了可選編碼,幾種流行的瀏覽器一般將它們看做標記的起始和結束字符。為了不造成服務器和客戶端的字符編碼的不一致,Web服務器應該明確設置字符集,以確認插入的數據是否為特殊字符編碼的后續字節。比如,下面的代碼強行設置了頁面使用ISO-8859-1字符集編碼:
<HTML>
<HEAD>
<META http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">
<TITLE>HTML SAMPLE</TITLE>
</HEAD>
<BODY>
<P>This is a sample HTML page
</BODY>
</HTML>
該文章轉載自1024k:http://www.1024k.cn/web/2007/200701/15409.html
本來以為上一次的配置就搞定了,結果本地測試好好的,到了服務器上調試就完蛋了,本地只測試了一個ASP站和一個JSP站,而實際情況是多個asp站和jsp站,又試了兩次還是不行,終于在第三次嘗試后搞定了,寫下來做個紀念。
第一次嘗試使用:
<VirtualHost *:80>
ServerAdmin feifei0658@sina.com
ServerName www.5hope.com
DcumentRoot "G:\5hope
DirectoryIndex index.html index.htm index.asp
ProxyPass / http://www.5hope.com:88/
ProxyPassReverse / www.5hope.com:88/
</VirtualHost>
<VirtualHost *:80>
ServerAdmin feifei0658@sina.com
ServerName www.shundabanjia.com
DocumentRoot "G:\wuyubing\www"
DirectoryIndex index.html index.htm index.asp
ProxyPass / http://www.shundabanjia.com:88/
ProxyPassReverse / http://www.shundabanjia.com:88/
</VirtualHost>
本以為這樣設置多站點就搞定了,結果發現只識別第一個站點,訪問別的站點都是這個站的內容,折騰了一上午,沒成功。
第二次嘗試使用:
<VirtualHost *:80>
#添加了這個屬性**********
ProxyPreserveHost On
ServerAdmin feifei0658@sina.com
ServerName www.shundabanjia.com
DocumentRoot "G:\wuyubing\www"
DirectoryIndex index.html index.htm index.asp
ProxyPass / http://www.shundabanjia.com:88/
ProxyPassReverse / http://www.shundabanjia.com:88/
</VirtualHost>
LoadModule jk_module modules/mod_jk.so
JkWorkersFile "D:\tomcat5.0.28\conf\workers.properties"
<VirtualHost *:80>
ServerAdmin feifei0658@sina.com
ServerName www.openria.cn
DirectoryIndex index.html index.htm index.jsp
JkMount /* ajp13
JkAutoAlias "D:\tomcat-5.0.28\Webapps\ria"
<Directory "D:\tomcat-5.0.28\webapps\ria">
Options Indexes FollowSymLinks
allow from all
</Directory>
</VirtualHost>
這回經過查官方資料,發現了一個屬性,叫ProxyPreserveHost On,試了一下,是可以用實現多個虛擬的asp站點了,但是和我的tomcat站點定義沖突,訪問不了jsp站,又不行,只好再找。
第三次嘗試使用:
NameVirtualHost *:80
<VirtualHost *:80>
ProxyPreserveHost On
ServerAdmin feifei0658@sina.com
ServerName www.shundabanjia.com
DocumentRoot "G:\wuyubing\www"
DirectoryIndex index.html index.htm index.asp
ProxyPass / http://www.shundabanjia.com:88/
ProxyPassReverse / http://www.shundabanjia.com:88/
</VirtualHost>
LoadModule jk_module modules/mod_jk.so
JkWorkersFile "D:\tomcat5.0.28\conf\workers.properties"
<VirtualHost *:80>
ServerAdmin feifei0658@sina.com
ServerName www.openria.cn
DirectoryIndex index.html index.htm index.jsp
JkMount /* ajp13
JkAutoAlias "D:\tomcat-5.0.28\webapps\ria"
<Directory "D:\tomcat-5.0.28\webapps\ria">
Options Indexes FollowSymLinks
allow from all
</Directory>
</VirtualHost>
經過反復看文檔,這回終于搞定了,原來是沒有吧"Use name-based virtual hosting."打開,去掉NameVirtualHost *:80前面的#號就可以了,真是暈啊。
總算成功了,看來有問題還需要看官方資料,網友的資料還是不完整啊,通過自己的努力,發現新的線索:
ProxyPreserveHost On
NameVirtualHost *:80
這也是自己的收獲啊,希望這些經歷能幫助需要他的人。
再次慶祝一下,自己的網站終于要開通了,歡迎訪問:www.openria.cn
該文章轉載自1024k:http://www.1024k.cn/web/2007/200701/15431.html
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<title>圖片滾動</title>
<style type="text/css">
<!--
body{
background-image:url('../../
background-repeat:no-repeat;
padding-top:80px;
}
#dhtmlgoodies_slideshow{
width:600px; /* Total width of slideshow */
}
#previewPane{
border:1px solid #CCCCCC;
margin-bottom:10px;
text-align:center;
vertical-align:middle;
padding-top:10px;
background-color:#CCC;
position:relative;
/* CSS HACK */
height: 432px; /* IE 5.x */
height/* */:/**/420px; /* Other browsers */
height: /**/420px;
}
#previewPane img{
line-height:400px;
}
#previewPane #largeImageCaption{ /* CSS styling of image caption below large image */
font-style:italic;
text-align:center;
font-family: Trebuchet MS, Lucida Sans Unicode, Arial, sans-serif; /* Font to use */
font-size:0.9em;
}
#galleryContainer{
height:102px; /* Height of the http://www.sanda.com.cn/new/image + 2 */
border:1px solid #CCCCCC;
position:relative;
overflow:hidden;
padding:1px;
/* CSS HACK */
height: 104px; /* IE 5.x - Added 2 pixels for border left and right */
height/* */:/**/102px; /* Other browsers */
height: /**/102px;
}
#arrow_left{
position:absolute;
left:0px;
z-index:10;
background-color: #FFF;
padding:1px;
}
#arrow_right{
position:absolute;
right:0px;
z-index:10;
background-color: #FFF;
padding:1px;
}
#theImages{
position:absolute;
height:100px;
left:40px;
width:100000px;
}
#theImages #slideEnd{
float:left;
}
#theImages img{
float:left;
padding:1px;
filter: alpha(opacity=50);
opacity: 0.5;
cursor:pointer;
border:0px;
}
#waitMessage{
display:none;
position:absolute;
left:200px;
top:150px;
background-color:#FFF;
border:3px double #000;
padding:4px;
color:#555;
font-size:0.9em;
font-family:arial;
}
#theImages .imageCaption{
display:none;
}
-->
</style>
<script type="text/javascript" >
var displayWaitMessage=true; // Display a please wait message while http://www.sanda.com.cn/new/image are loading?
var activeImage = false;
var imageGalleryLeftPos = false;
var imageGalleryWidth = false;
var imageGalleryObj = false;
var maxGalleryXPos = false;
var slideSpeed = 0;
var imageGalleryCaptions = new Array();
function startSlide(e)
{
if(document.all)e = event;
var id = this.id;
this.getElementsByTagName('IMG')[0].src = ' + this.id + '_over.gif';
if(this.id=='arrow_right'){
slideSpeedMultiply = Math.floor((e.clientX - this.offsetLeft) / 5);
slideSpeed = -1*slideSpeedMultiply;
slideSpeed = Math.max(-10,slideSpeed);
}else{
slideSpeedMultiply = 10 - Math.floor((e.clientX - this.offsetLeft) / 5);
slideSpeed = 1*slideSpeedMultiply;
slideSpeed = Math.min(10,slideSpeed);
if(slideSpeed<0)slideSpeed=10;
}
}
function releaseSlide()
{
var id = this.id;
this.getElementsByTagName('IMG')[0].src = ' + this.id + '.gif';
slideSpeed=0;
}
function gallerySlide()
{
if(slideSpeed!=0){
var leftPos = imageGalleryObj.offsetLeft;
leftPos = leftPos/1 + slideSpeed;
if(leftPos>maxGalleryXPos){
leftPos = maxGalleryXPos;
slideSpeed = 0;
}
if(leftPos<minGalleryXPos){
leftPos = minGalleryXPos;
slideSpeed=0;
}
imageGalleryObj.style.left = leftPos + 'px';
}
setTimeout('gallerySlide()',20);
}
function showImage()
{
if(activeImage){
activeImage.style.filter = 'alpha(opacity=50)';
activeImage.style.opacity = 0.5;
}
this.style.filter = 'alpha(opacity=100)';
this.style.opacity = 1;
activeImage = this;
}
function initSlideShow()
{
document.getElementById('arrow_left').onmousemove = startSlide;
document.getElementById('arrow_left').onmouseout = releaseSlide;
document.getElementById('arrow_right').onmousemove = startSlide;
document.getElementById('arrow_right').onmouseout = releaseSlide;
imageGalleryObj = document.getElementById('theImages');
imageGalleryLeftPos = imageGalleryObj.offsetLeft;
imageGalleryWidth = document.getElementById('galleryContainer').offsetWidth - 80;
maxGalleryXPos = imageGalleryObj.offsetLeft;
minGalleryXPos = imageGalleryWidth - document.getElementById('slideEnd').offsetLeft;
var slideshowImages = imageGalleryObj.getElementsByTagName('IMG');
for(var no=0;no<slideshowImages.length;no++){
slideshowImages[no].onmouseover = showImage;
}
var divs = imageGalleryObj.getElementsByTagName('DIV');
for(var no=0;no<divs.length;no++){
if(divs[no].className=='imageCaption')imageGalleryCaptions[imageGalleryCaptions.length] = divs[no].innerHTML;
}
gallerySlide();
}
function showPreview(imagePath,imageIndex){
var subImages = document.getElementById('previewPane').getElementsByTagName('IMG');
if(subImages.length==0){
var img = document.createElement('IMG');
document.getElementById('previewPane').appendChild(img);
}else img = subImages[0];
if(displayWaitMessage){
document.getElementById('waitMessage').style.display='inline';
}
document.getElementById('largeImageCaption').style.display='none';
img.onload = function() { hideWaitMessageAndShowCaption(imageIndex-1); };
img.src = imagePath;
}
function hideWaitMessageAndShowCaption(imageIndex)
{
document.getElementById('waitMessage').style.display='none';
document.getElementById('largeImageCaption').innerHTML = imageGalleryCaptions[imageIndex];
document.getElementById('largeImageCaption').style.display='block';
}
window.onload = initSlideShow;
</script>
</head>
<body>
<div id="dhtmlgoodies_slideshow">
<div id="galleryContainer">
<div id="arrow_left"><img src="></div>
<div id="arrow_right"><img src="></div>
<div id="theImages">
<!-- Thumbnails -->
<a href="#"><img src="></a>
<a href="#"><img src="></a>
<a href="#"><img src="></a>
<a href="#"><img src="></a>
<a href="#"><img src="></a>
<a href="#"><img src="></a>
<a href="#"><img src="></a>
<a href="#" ><img src="></a>
<!-- End thumbnails -->
<!-- Image captions -->
<div class="imageCaption">圖片1</div>
<div class="imageCaption">圖片 2</div>
<div class="imageCaption">圖片 3</div>
<div class="imageCaption">圖片4</div>
<div class="imageCaption">圖片 5</div>
<div class="imageCaption">圖片 6</div>
<div class="imageCaption">圖片 7</div>
<div class="imageCaption">圖片 8</div>
<!-- End image captions -->
<div id="slideEnd"></div>
</div>
</div>
</div>
</body>
</html>