99精品视频免费,亚洲免费视频在线观看,久久精品成人一区二区三区蜜臀

　　使用Lucene實(shí)現(xiàn)全文檢索，主要有下面三個(gè)步驟：
　　1、建立索引庫(kù)：根據(jù)網(wǎng)站新聞信息庫(kù)中的已有的數(shù)據(jù)資料建立Lucene索引文件。
　　2、通過(guò)索引庫(kù)搜索：有了索引后，即可使用標(biāo)準(zhǔn)的詞法分析器或直接的詞法分析器實(shí)現(xiàn)進(jìn)行全文檢索。
　　3、維護(hù)索引庫(kù)：網(wǎng)站新聞信息庫(kù)中的信息會(huì)不斷的變動(dòng)，包括新增、修改及刪除等，這些信息的變動(dòng)都需要進(jìn)一步反映到Lucene索引文件中。
下面是myrss.easyjf.com相關(guān)代碼!

一、索引管理(建立及維護(hù))
　　索引管理類MyRssIndexManage主要實(shí)現(xiàn)根據(jù)網(wǎng)站信息庫(kù)中的數(shù)據(jù)建立索引，維護(hù)索引等。由于索引的過(guò)程需要消耗一定的時(shí)間，因此，索引管理類實(shí)現(xiàn)Runnable接口，使得我們可以在程序中開(kāi)新線程來(lái)運(yùn)行。

package com.easyjf.lucene;

import java.util.Date;

import java.util.List;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.index.IndexReader;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.queryParser.MultiFieldQueryParser;

import org.apache.lucene.queryParser.QueryParser;

import org.apache.lucene.search.Hits;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.Query;

import org.apache.lucene.search.Searcher;

import com.easyjf.dbo.EasyJDB;

import com.easyjf.news.business.NewsDir;

import com.easyjf.news.business.NewsDoc;

import com.easyjf.news.business.NewsUtil;

import com.easyjf.web.tools.IPageList;

public class MyRssIndexManage implements Runnable {

private String indexDir;

private String indexType="add";

public void run() {

// TODO Auto-generated method stub

if("add".equals(indexType))

normalIndex();

else if ("init".equals(indexType)) reIndexAll();

}

public void normalIndex()

{

try{

Date start = new Date();

int num=0;

IndexWriter writer=new IndexWriter(indexDir,new StandardAnalyzer(),false);

//NewsDir dir=NewsDir.readBySn();

String scope="(needIndex<2) or(needIndex is null)";

IPageList pList=NewsUtil.pageList(scope,1,50);

for(int p=0;p<pList.getPages();p++)

{

pList=NewsUtil.pageList(scope,p,100);

List list=pList.getResult();

for(int i=0;i<list.size();i++)

{

NewsDoc doc=(NewsDoc)list.get(i);

writer.addDocument(newsdoc2lucenedoc(doc));

num++;

}

writer.optimize();

writer.close();

EasyJDB.getInstance().execute("update NewsDoc set needIndex=2 where "+scope);

Date end = new Date();

System.out.print("新增索引"+num+"條信息，一共花："+(end.getTime() - start.getTime())/60000+"分鐘!");

}

catch(Exception e)

{

e.printStackTrace();

}

public void reIndexAll()

{

try{

Date start = new Date();

int num=0;

IndexWriter writer=new IndexWriter(indexDir,new StandardAnalyzer(),true);

NewsDir dir=NewsDir.readBySn("easyjf");

IPageList pList=NewsUtil.pageList(dir,1,50);

for(int p=0;p<pList.getPages();p++)

{

pList=NewsUtil.pageList(dir,p,100);

List list=pList.getResult();

for(int i=0;i<list.size();i++)

{

NewsDoc doc=(NewsDoc)list.get(i);

writer.addDocument(newsdoc2lucenedoc(doc));

num++;

}

writer.optimize();

writer.close();

EasyJDB.getInstance().execute("update NewsDoc set needIndex=2 where dirPath like 'easyjf%'");

Date end = new Date();

System.out.print("全部重新做了一次索引，一共處理了"+num+"條信息，花："+(end.getTime() - start.getTime())/60000+"分鐘!");

}

catch(Exception e)

{

e.printStackTrace();

}

private Document newsdoc2lucenedoc(NewsDoc doc)

{

Document lDoc=new Document();

lDoc.add(new Field("title",doc.getTitle(),Field.Store.YES,Field.Index.TOKENIZED));

lDoc.add(new Field("content",doc.getContent(),Field.Store.YES,Field.Index.TOKENIZED));

lDoc.add(new Field("url",doc.getRemark(),Field.Store.YES,Field.Index.NO));

lDoc.add(new Field("cid",doc.getCid(),Field.Store.YES,Field.Index.NO));

lDoc.add(new Field("source",doc.getSource(),Field.Store.YES,Field.Index.NO));

lDoc.add(new Field("inputTime",doc.getInputTime().toString(),Field.Store.YES,Field.Index.NO));

return lDoc;

}

public String getIndexDir() {

return indexDir;

}

public void setIndexDir(String indexDir) {

this.indexDir = indexDir;

}

public String getIndexType() {

return indexType;

}

public void setIndexType(String indexType) {

this.indexType = indexType;

}

二、使用Lucene實(shí)現(xiàn)全文搜索
下面是MyRssSearch類的源碼，該類主要實(shí)現(xiàn)使用Lucene中Searcher及QueryParser實(shí)現(xiàn)從索引庫(kù)中搜索關(guān)鍵詞。

package com.easyjf.lucene;

import java.util.List;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.index.IndexReader;

import org.apache.lucene.queryParser.MultiFieldQueryParser;

import org.apache.lucene.queryParser.QueryParser;

import org.apache.lucene.search.Hits;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.Query;

import org.apache.lucene.search.Searcher;

import com.easyjf.search.MyRssUtil;

import com.easyjf.search.SearchContent;

import com.easyjf.web.tools.IPageList;

import com.easyjf.web.tools.PageList;

public class MyRssSearch {

private String indexDir;

IndexReader ir;

Searcher search;

public IPageList search(String key,int pageSize,int currentPage)

{

IPageList pList=new PageList(new HitsQuery(doSearch(key)));

pList.doList(pageSize,currentPage,"","",null);

if(pList!=null)

{

List list=pList.getResult();

if(list!=null){

for(int i=0;i<list.size();i++)

{

list.set(i,lucene2searchObj((Document)list.get(i),key));

}

try{

if(search!=null)search.close();

if(ir!=null)ir.close();

}

catch(Exception e)

{

e.printStackTrace();

}

return pList;

}

private SearchContent lucene2searchObj(Document doc,String key)

{

SearchContent searchObj=new SearchContent();

String title=doc.getField("title").stringValue();

searchObj.setTitle(title.replaceAll(key,"<font color=red>"+key+"</font>"));

searchObj.setTvalue(doc.getField("cid").stringValue());

searchObj.setUrl(doc.getField("url").stringValue());

searchObj.setSource(doc.getField("source").stringValue());

searchObj.setLastUpdated(doc.getField("inputTime").stringValue());

searchObj.setIntro(MyRssUtil.content2intro(doc.getField("content").stringValue(),key));

return searchObj;

}

public Hits doSearch(String key)

{

Hits hits=null;

try{

ir=IndexReader.open(indexDir);

search=new IndexSearcher(ir);

String fields[]={"title","content"};

QueryParser parser=new MultiFieldQueryParser(fields,new StandardAnalyzer());

Query query=parser.parse(key);

hits=search.search(query);

}

catch(Exception e)

{

e.printStackTrace();

}

//System.out.println("搜索結(jié)果:"+hits.length());

return hits;

}

public String getIndexDir() {

return indexDir;

}

public void setIndexDir(String indexDir) {

this.indexDir = indexDir;

}

　在上面的代碼中，search方法返回一個(gè)封裝了分頁(yè)查詢結(jié)果的IPageList，IPageList是EasyJWeb Tools業(yè)務(wù)引擎中的分頁(yè)引擎，對(duì)于IPageList的使用，請(qǐng)看本人寫(xiě)的這篇文章《EasyJWeb Tools中業(yè)務(wù)引擎分頁(yè)的設(shè)計(jì)實(shí)現(xiàn)》：

　　我們針對(duì)Lucene的的查詢結(jié)果Hits結(jié)構(gòu)，寫(xiě)了一個(gè)查詢器HitsQuery。代碼如下所示：

package com.easyjf.lucene;

import java.util.ArrayList;

import java.util.Collection;

import java.util.List;

import org.apache.lucene.search.Hits;

import com.easyjf.web.tools.IQuery;

public class HitsQuery implements IQuery {

private int begin=0;

private int max=0;

private Hits hits;

public HitsQuery()

{

}

public HitsQuery(Hits hits)

{

if(hits!=null)

{

this.hits=hits;

this.max=hits.length();

}

public int getRows(String arg0) {

// TODO Auto-generated method stub

return (hits==null?0:hits.length());

}

public List getResult(String arg0) {

// TODO Auto-generated method stub

List list=new ArrayList();

for(int i=begin;i<(begin+max)&&(i<hits.length());i++)

{

try{

list.add(hits.doc(i));

}

catch(Exception e)

{

e.printStackTrace();

}

return list;

}

public void setFirstResult(int begin) {

// TODO Auto-generated method stub

this.begin=begin;

}

public void setMaxResults(int max) {

// TODO Auto-generated method stub

this.max=max;

}

public void setParaValues(Collection arg0) {

// TODO Auto-generated method stub

}

public List getResult(String condition, int begin, int max) {

// TODO Auto-generated method stub

if((begin>=0)&&(begin<max))this.begin=begin;

if(!(max>hits.length()))this.max=max;

return getResult(condition);

}

三、Web調(diào)用
　　下面我們來(lái)看看在Web中如果調(diào)用商業(yè)邏輯層的全文檢索功能。下面是處理用戶請(qǐng)請(qǐng)的Action中關(guān)于搜索部分的源碼：

package com.easyjf.news.action;

public class SearchAction implements IWebAction {

public Page doSearch(WebForm form,Module module)throws Exception

{

String key=CommUtil.null2String(form.get("v"));

key=URLDecoder.decode(URLEncoder.encode(key,"ISO8859_1"),"utf-8");

form.set("v",key);

form.addResult("v2",URLEncoder.encode(key,"utf-8"));

if(key.getBytes().length>2){

String orderBy=CommUtil.null2String(form.get("order"));

int currentPage=CommUtil.null2Int(form.get("page"));

int pageSize=CommUtil.null2Int(form.get("pageSize"));

if(currentPage<1)currentPage=1;

if(pageSize<1)pageSize=15;

SearchEngine search=new SearchEngine(key,orderBy,pageSize,currentPage);

search.getLuceneSearch().setIndexDir(Globals.APP_BASE_DIR+"/WEB-INF/index");

search.doSearchByLucene();

IPageList pList=search.getResult();

if(pList!=null && pList.getRowCount()>0){

form.addResult("list",pList.getResult());

form.addResult("pages",new Integer(pList.getPages()));

form.addResult("rows",new Integer(pList.getRowCount()));

form.addResult("page",new Integer(pList.getCurrentPage()));

form.addResult("gotoPageHTML",CommUtil.showPageHtml(pList.getCurrentPage(),pList.getPages()));

}

else

{

form.addResult("notFound","true");//找不到數(shù)據(jù)

}

else

form.addResult("errMsg","您輸入的關(guān)鍵字太短!");

form.addResult("hotSearch",SearchEngine.getHotSearch(20));

return null;

}

其中調(diào)用的SearchEngine類中有關(guān)Lucene部分的源碼：
public class SearchEngine {
private MyRssSearch luceneSearch=new MyRssSearch();
public void doSearchByLucene()
{
SearchKey keyObj=readCache();
if(keyObj!=null){
result=luceneSearch.search(key,pageSize,currentPage);
if(updateStatus){
keyObj.setReadTimes(new Integer(keyObj.getReadTimes().intValue()+1));
keyObj.update();
}
}
else//緩存中沒(méi)有該關(guān)鍵字信息,生成關(guān)鍵字搜索結(jié)果
{
keyObj=new SearchKey();
keyObj.setTitle(key);
keyObj.setLastUpdated(new Date());
keyObj.setReadTimes(new Integer(1));
keyObj.setStatus(new Integer(0));
keyObj.setSequence(new Integer(1));
keyObj.setVdate(new Date());
keyObj.save();
result=luceneSearch.search(key,pageSize,currentPage);;

}
}
}

發(fā)表于 2008-01-14 10:38 大田斗閱讀(1637) 評(píng)論(0) 編輯收藏所屬分類: Lucene

lucene全文檢索應(yīng)用示例及代碼簡(jiǎn)析

導(dǎo)航

統(tǒng)計(jì)

常用鏈接

留言簿(5)

隨筆檔案

文章分類

文章檔案

java

工具

朋友

搜索

積分與排名

最新評(píng)論

閱讀排行榜

評(píng)論排行榜