??xml version="1.0" encoding="utf-8" standalone="yes"?> 首先,Z一个简单的新闻pȝ,要想做全文检?新闻pȝ的管理等在这里不在具体提?下面列出新闻对象的类:
?E序用会C些工L,不在此列?用户可以自己实现.
package com.jscud.website.newsinfo.bean;
import java.sql.Timestamp;
import com.jscud.util.DateTime;
import com.jscud.util.StringFunc;
import com.jscud.website.newsinfo.NewsConst;
/**
* 一个新?
*
* @author scud(飞云侠) http://www.jscud.com
*
*/
public class NewsItem
{
private int nid; //新闻~号
private int cid; //cd~号
private String title;//标题
private int showtype; //内容cd:目前支持url和html
private String content;//内容
private String url;//对应|址,如果内容cd是url的话
private Timestamp addtime; //增加旉
private int click; //点击?br />
//对应的get,set函数,较多不在列出,可以使用工具生成
//......
/**
* 按照cd格式?br />
*/
public String getShowContent()
{
String sRes = content;
if(showtype == NewsConst.ShowType_HTML)
{
}
return sRes;
}
public String getTarget()
{
if(showtype == NewsConst.ShowType_URL)
{
return "_blank";
}
else
return "";
}
/**
* 静态Html文g的\径及其名?br />
*/
public String getHtmlFileName()
{
int nYear = DateTime.getYear_Date(getAddtime());
int nMonth = DateTime.getMonth_Date(getAddtime());
String sGeneFileName =
"/news/" + getCid() + "/" + nYear + "/" + nMonth +"/" + getNid() + ".htm";
return sGeneFileName;
}
/**
* 静态Html文g的\?br />
*/
public String getHtmlFilePath()
{
int nYear = DateTime.getYear_Date(getAddtime());
int nMonth = DateTime.getMonth_Date(getAddtime());
String sGeneFilePath =
getCid() + "_" + nYear + "_" + nMonth;
return sGeneFilePath;
}
}
可以看到,我们需要对标题和内容进行检?Zq个目的,我们首先需要来研究一下lucene.
在Lucene?如果要进行全文检?必须要先建立索引然后才能q行?当然实际工作中还会有删除索引和更新烦引的工作.
在此之前,介绍一个最基本的类(摘抄?a href="http://www.aygfsteel.com/cap/archive/2005/07/17/7849.html">http://www.aygfsteel.com/cap/archive/2005/07/17/7849.html):
Analyzer 文g的分析器Q听h别扭Q还是叫Analyzer好了)的抽象,q个cȝ来处理分?对中文尤光要,转换大小?Computer->computer,实现查询大小写无?Q{换词?computers->computer),消除stop words{?q负责把其他格式文档转换为纯文本{?
在lucene?一般会使用StandardAnalyzer来分析内?它支持中文等多字节语a,当然可以自己实现Ҏ的解析器.StandardAnalyzer目前对中文的处理是按照单字来处理?q是最单的办法,但是也有~点,会组合出一些没有意义的l果?
首先我们来了解徏立烦?建立索引包含2U情?一U是l一条新d立烦?另外的情冉|在开始或者一定的旉l批量的新闻建立索引,所以ؓ了通用,我们写一个通用的徏立烦引的函数:
(一般一cȝ索引都放在一个目录下,q个配置可以在函C定义,也可以写在配|文件中,通过参数传递给函数.)
/** * 生成索引. * * @param doc 目标文档 * @param indexDir 索引目录 */ public static void makeIndex(Document doc, String indexDir) { List aList = new ArrayList(); aList.add(doc); makeIndex(aList, indexDir); } /** * 生成索引. * * @param doc 生成的document. * @param indexDir 索引目录 */ public static void makeIndex(List docs, String indexDir) { if (null == docs) { return; } boolean indexExist = indexExist(indexDir); IndexWriter writer = null; //d一条文?br />
for (int i = 0; i < docs.size(); i++) //索引完成后的处理 |
可以看到,建立索引用到cLIndexWrite,它可以新建烦引或者追加烦?但是需要自己判?判断是通过IndexReaderq个cL实现?函数如下:
/** * 查烦引是否存? * @param indexDir * @return */ public static boolean indexExist(String indexDir) { return IndexReader.indexExists(indexDir); } |
如果每次都是新徏索引的话,会把原来的记录删?我在使用的时候一开始就没有注意?后来观察了一下烦引文?才发现这个问?
q可以看?建立索引是给用户的Document对象建立索引,Document表示索引中的一条文档记?那么我们如何建立一个文档那?以新ȝlؓ?代码如下:
/** * 生成新闻的Document. * * @param aNews 一条新? * * @return lucene的文档对?br /> */ public static Document makeNewsSearchDocument(NewsItem aNews) { Document doc = new Document(); doc.add(Field.Keyword("nid", String.valueOf(aNews.getNid()))); doc.add(Field.Text("title", aNews.getTitle())); //对Htmlq行解析,如果不是html,则不需要解?或者根据格式调用自q解析Ҏ String content = parseHtmlContent(aNews.getContent()); doc.add(Field.UnStored("content", content)); doc.add(Field.Keyword("addtime", aNews.getAddtime())); //可以加入其他的内?例如新闻的评论等 doc.add(Field.UnStored("other", "")); //讉Kurl String newsUrl = "/srun/news/viewhtml/" + aNews.getHtmlFilePath() + "/" + aNews.getNid() + ".htm"; doc.add(Field.UnIndexed("visiturl", newsUrl)); return doc; } |
通过上面的代?我们把一条新闻{换ؓlucene的Document对象,从而进行烦引工?在上面的代码?我们又引入了lucene中的Field(字段)c?Document文档像数据库中的一条记?它有很多字段,每个字段是一个Field对象.
从别的文章摘抄一D关于Field的说?摘抄?a href="http://www.aygfsteel.com/cap/archive/2005/07/17/7849.html">http://www.aygfsteel.com/cap/archive/2005/07/17/7849.html):
[quote]
cd Analyzed Indexed Stored 说明
Field.Keyword(String,String/Date) N Y Y q个Field用来储存会直接用来检索的比如(~号,姓名,日期{?
Field.UnIndexed(String,String) N N Y 不会用来索的信息,但是索后需要显C的,比如,g序列?文档的url地址
Field.UnStored(String,String) Y Y N 大段文本内容,会用来检?但是索后不需要从index中取内容,可以Ҏurl去load真实的内?
Field.Text(String,String) Y Y Y ?获取都需要的内容,直接放index?不过q样会增大index
Field.Text(String,Reader) Y Y N 如果是一个Reader, lucene猜测内容比较?会采用Unstored的策?
[/quote]
我们可以看到新闻的编h直接用来索的,所以是Keywordcd的字D?新闻的标题是需要检索和昄用的,所以是Textcd,而新ȝ内容因ؓ是Html格式?所以在l过解析器的处理?使用的UnStored的格?而新ȝ旉是直接用来检索的,所以是KeyWordcd.Z在新ȝ引后用户可以讉K到完整的新闻面,q设|了一个UnIndexedcd的访问地址字段.
(对Htmlq行解析的处理稍后在q行讲解)
Z条新d立烦引需要两个步?获取Document,传给makeIndex函数,代码如下:
public static void makeNewsInfoIndex(NewsItem aNews) { if (null == aNews) { return; } makeIndex(makeNewsSearchDocument(aNews),indexDir); } |
建立索引的工作就q行完了,只要在增加新d调用 makeNewsInfoIndex(newsitem); 可以徏立烦引了.
如果需要删除新?那么也要删除对应的烦?删除索引是通过IndexReadercL完成?
/** * 删除索引. * @param aTerm 索引删除条g * @param indexDir 索引目录 */ public static void deleteIndex(Term aTerm, String indexDir) { List aList = new ArrayList(); aList.add(aTerm); deleteIndex(aList, indexDir); } /** IndexReader reader = null; |
删除索引需要一个条?cM数据库中的字D|?例如删除一条新ȝ代码如下:
public static void deleteNewsInfoIndex(int nid) { Term aTerm = new Term("nid", String.valueOf(nid)); deleteIndex(aTerm,indexDir); } |
通过新闻的ID,可以删除一条新?
如果需要更新新?如何更新索引? 更新索引需要先删除索引然后新徏索引2个步?其实是把上面的代码l合h,例如更新一条新?
public static void updateNewsInfoIndex(NewsItem aNews) { if (null == aNews) { return; } deleteNewsInfoIndex(aNews.getNid()); makeNewsInfoIndex(aNews); } |
x,索引的徏立更新和删除告一D落?其中扚w更新新闻的代码如?
(扚w更新应该在访问h数少或者后台程序在夜间执行)
public static void makeAllNewsInfoIndex(List newsList) { List terms = new ArrayList(); List docs = new ArrayList(); for (int i = 0; i < newsList.size(); i++) deleteIndex(terms,indexDir); |
Iterator it = list.iterator(); while(it.hasNext()){ //using “it.next();”do some businesss logic } |
![]() |
//q代器角Ԍ仅仅定义了遍历接?br />
public interface Iterator { boolean hasNext(); Object next(); void remove(); } //容器角色Q这里以ListZ。它也仅仅是一个接口,׃|列出来?br /> //具体容器角色Q便是实CList接口?a class="bluekey" target="_blank">ArrayList{类。ؓ了突出重点这里指|列和P代器相关的内?br /> //具体q代器角Ԍ它是以内部类的Ş式出来的。AbstractList是ؓ了将各个具体容器角色?a class="bluekey" target="_blank">公共部分提取出来而存在的?br /> public abstract class AbstractList extends AbstractCollection implements List { …… //q个便是负责创徏具体q代器角色的工厂Ҏ public Iterator iterator() { return new Itr(); } //作ؓ内部cȝ具体q代器角?br /> private class Itr implements Iterator { int cursor = 0; int lastRet = -1; int expectedModCount = modCount; public boolean hasNext() { return cursor != size(); } public Object next() { checkForComodification(); try { Object next = get(cursor); lastRet = cursor++; return next; } catch(IndexOutOfBoundsException e) { checkForComodification(); throw new NoSuchElementException(); } } public void remove() { if (lastRet == -1) throw new IllegalStateException(); checkForComodification(); try { AbstractList.this.remove(lastRet); if (lastRet < cursor) cursor--; lastRet = -1; expectedModCount = modCount; } catch(IndexOutOfBoundsException e) { throw new ConcurrentModificationException(); } } final void checkForComodification() { if (modCount != expectedModCount) throw new ConcurrentModificationException(); } } |
转换原则Q?br />
从低_ֺ向高_ֺ转换
byte 、short、int、long、float、double、char
注:两个char型运时Q自动{换ؓint型;当char与别的类型运时Q也会先自动转换为int型的Q再做其它类型的自动转换
基本cd向类cd转换
正向转换Q?br /> 通过cd装器来newZ个新的类cd的变?br /> Integer a= new Integer(2);
反向转换Q?br />
通过cd装器来{?br />
int b=a.intValue();
cȝ型向字符串{?/p>
正向转换Q?br />
因ؓ每个c都是objectcȝ子类Q而所有的objectc都有一个toString()函数Q所以通过toString()函数来{换即?/p>
反向转换Q?br />
通过cd装器newZ个新的类cd的变?br />
eg1: int i=Integer.valueOf(“123”).intValue()
说明Q上例是一个字W串转化成一个Integer对象Q然后再调用q个对象的intValue()Ҏq回其对应的int数倹{?br />
eg2: float f=Float.valueOf(“123”).floatValue()
说明Q上例是一个字W串转化成一个Float对象Q然后再调用q个对象的floatValue()Ҏq回其对应的float数倹{?br />
eg3: boolean b=Boolean.valueOf(“123”).booleanValue()
说明Q上例是一个字W串转化成一个Boolean对象Q然后再调用q个对象的booleanValue()Ҏq回其对应的boolean数倹{?br />
eg4:Double d=Double.valueOf(“123”).doubleValue()
说明Q上例是一个字W串转化成一个Double对象Q然后再调用q个对象的doubleValue()Ҏq回其对应的double数倹{?br />
eg5: long l=Long.valueOf(“123”).longValue()
说明Q上例是一个字W串转化成一个Long对象Q然后再调用q个对象的longValue()Ҏq回其对应的long数倹{?br />
eg6: char=Character.valueOf(“123”).charValue()
说明Q上例是一个字W串转化成一个Character对象Q然后再调用q个对象的charValue()Ҏq回其对应的char数倹{?/p>
基本cd向字W串的{?/p>
正向转换Q?br />
如:int a=12;
String b;
b=a+””;
反向转换Q?br />
通过cd装器
eg1:
int i=Integer.parseInt(“123”)
说明Q此Ҏ只能适用于字W串转化成整型变?br />
eg2: float f=Float.valueOf(“123”).floatValue()
说明Q上例是一个字W串转化成一个Float对象Q然后再调用q个对象的floatValue()Ҏq回其对应的float数倹{?br />
eg3: boolean b=Boolean.valueOf(“123”).booleanValue()
说明Q上例是一个字W串转化成一个Boolean对象Q然后再调用q个对象的booleanValue()Ҏq回其对应的boolean数倹{?br />
eg4:Double d=Double.valueOf(“123”).doubleValue()
说明Q上例是一个字W串转化成一个Double对象Q然后再调用q个对象的doubleValue()Ҏq回其对应的double数倹{?br />
eg5: long l=Long.valueOf(“123”).longValue()
说明Q上例是一个字W串转化成一个Long对象Q然后再调用q个对象的longValue()Ҏq回其对应的long数倹{?br />
eg6: char=Character.valueOf(“123”).charValue()
说明Q上例是一个字W串转化成一个Character对象Q然后再调用q个对象的charValue()Ҏq回其对应的char数倹{?/p>
1、java数据?/font>操作基本程
2、几个常用的重要技巧:
·可滚动、更新的记录?/p>
·扚w更新
·事务处理
java数据?/font>操作基本程Q取?a target="_blank">数据?/font>q接 - 执行sql语句 - 处理执行l果 - 释放数据?/font>q接
1、取?a target="_blank">数据?/font>q接
1)用DriverManager?a target="_blank">数据?/font>q接
例子
String className,url,uid,pwd;
className = "oracle.jdbc.driver.OracleDriver";
url = "jdbc:oracle:thin:@127.0.0.1:1521:orasvr;
uid = "system";
pwd = "manager";
Class.forName(className);
Connection cn = DriverManager.getConnection(url,uid,pwd);
2)用jndi(java的命名和目录服务)方式
例子
String jndi = "jdbc/db";
Context ctx = (Context) new InitialContext().lookup("java:comp/env");
DataSource ds = (DataSource) ctx.lookup(jndi);
Connection cn = ds.getConnection();
多用于jsp?/p>
2、执行sql语句
1)用Statement来执行sql语句
String sql;
Statement sm = cn.createStatement();
sm.executeQuery(sql); // 执行数据查询语句(select)
sm.executeUpdate(sql); // 执行数据更新语句(delete、update、insert、drop{?statement.close();
2)用PreparedStatement来执行sql语句
String sql;
sql = "insert into user (id,name) values (?,?)";
PreparedStatement ps = cn.prepareStatement(sql);
ps.setInt(1,xxx);
ps.setString(2,xxx);
...
ResultSet rs = ps.executeQuery(); // 查询
int c = ps.executeUpdate(); // 更新
3、处理执行结?/strong>
查询语句Q返回记录集ResultSet
更新语句Q返回数字,表示该更新媄响的记录?/p>
ResultSet的方?/p>
1、next()Q将游标往后移动一行,如果成功q回true;否则q回false
2、getInt("id")或getSting("name")Q返回当前游标下某个字段的?/p>
4、释放连?/strong>
cn.close();
一般,先关闭ResultSetQ然后关闭Statement(或者PreparedStatement);最后关闭Connection
可滚动、更新的记录?/p>
1、创建可滚动、更新的Statement
Statement sm = cn.createStatement(ResultSet.TYPE_SCROLL_ENSITIVE,ResultSet.CONCUR_READ_ONLY);
该Statement取得的ResultSet是可滚动的
2、创建PreparedStatement时指定参?/p>
PreparedStatemet ps = cn.prepareStatement(sql,ResultSet.TYPE_SCROLL_INSENSITIVE,ResultSet.CONCUR_READ_ONLY);
ResultSet.absolute(9000);
·扚w更新
1、Statement
Statement sm = cn.createStatement();
sm.addBatch(sql1);
sm.addBatch(sql2);
...
sm.executeBatch()
一个Statement对象Q可以执行多个sql语句以后Q批量更新。这多个语句可以是delete、update、insert{或兼有
2、PreparedStatement
PreparedStatement ps = cn.preparedStatement(sql);
{
ps.setXXX(1,xxx);
...
ps.addBatch();
}
ps.executeBatch();
一个PreparedStatementQ可以把一个sql语句Q变换参数多ơ执行,一ơ更新?/p>
·事务的处?/p>
1、关闭Connection的自动提?/p>
cn.setAutoCommit(false);
2、执行一pdsql语句
要点Q执行每一个新的sql语句前,上一ơ执行sql语句的Statement(或者PreparedStatemet)必须先close
Statement sm ;
sm = cn.createStatement(insert into user...);
sm.executeUpdate();
sm.close();
sm = cn.createStatement("insert into corp...);
sm.executeUpdate();
sm.close();
3、提?/p>
cn.commit();
4、如果发生异常,那么回滚
cn.rollback();