Lucene/Solrå¼€å‘ç»éªŒ[è½¬è²]

Wed, 26 Mar 2008 03:22:00 GMT

å¼ é©°æœ‰é“ http://www.jinsehupan.com/blog/?p=25
å¤šè°¢ä»–çš„ä»‹ç»ã€?br />

1ã€?strong>å¼€½‹‡è¯
2ã€?strong>æ¦‚è¿°
3ã€?strong>æ¸Šæº
4ã€?strong>åˆè¯†Solr
5ã€?strong>Solrçš„å®‰è£?/strong>
6ã€?strong>Solråˆ†è¯™åºåº
7ã€?strong>Solrä¸æ–‡åº”ç”¨çš„ä¸€ä¸ªå®žä¾?/strong>
8ã€?strong>Solrçš„æ£€ç´¢è¿½Ž—ç¬¦

[å¼€½‹‡è¯]æŒ‰ç…§æƒ¯ä¾‹åº”è¯¥å†™ä¸€½‹‡æŠ€æœ¯æ–‡ç« äº†åQŒè¿™‹Æ¡ç»“åˆLucene/Solræ¥åˆ†äº«ä¸€ä¸‹å¼€å‘ç»éªŒã€?/span>

Luceneæ˜¯ä¸€ä¸ªä‹Éç”¨Javaè¯è¨€å†™çš„å…¨æ–‡‹‚€ç´¢å¼€å‘åŒ…åQˆAPIåQ‰ï¼Œåˆ©ç”¨å®ƒå¯ä»¥å®žçŽ°å¼ºå¤§çš„‹‚€ç´¢åŠŸèƒ½ï¼Œå®ƒçš„è¯¦ç»†ä»‹ç»å¤§å®¶å¯ä»¥åŽ»Googleä¸Šæœç´¢ä¸€ä¸‹ï¼Œæœ¬æ–‡é‡ç‚¹æ”‘Öœ¨Solrç›¸å…³çš„è®¨è®ÞZ¸Šã€?/span>

[æ¦‚è¿°]ç›®å‰å›½å†…ç ”ç©¶Solrçš„ähä¸å¤šåQŒè€Œä¸”å¤§å¤šæ˜¯å› ä¸ºé¡¹ç›®å¼€å‘éœ€è¦ã€‚Solrå¸ˆæ‰¿LuceneåQŒäØ“ApacheåŸºé‡‘ä¼šä¸‹çš„ä¸€ä¸ªé¡¹ç›®ï¼Œå…·ä½“çš„è¯´å®ƒè¿˜æ˜¯Luceneä¸‹çš„ä¸€ä¸ªå™å¹ç›®ã€‚Solrå‡ø™ínè±ªé—¨åQŒè€Œä¸”å…ähœ‰è‡ªå·±çš„æŠ€æœ¯ç‰¹ç‚¹ï¼Œå¡«è¡¥äº†ä»¥å¾€Luceneä»…ä»…ä½œäØ“å¼€å‘å·¥å…·åŒ…çš„é—æ†¾ï¼Œå®ƒæ˜¯ä¸€ä¸ªå®Œå®Œæ•´æ•´åœ°åº”ç”¨ã€‚æ¢å¥è¯è¯ß_¼Œå®ƒæ˜¯ä¸€ä¸ªå…¨æ–‡æ£€ç´¢æœåŠ¡å™¨åQŒå®ƒå¼€½Ž±å³ç”¨ï¼Œè®©æˆ‘ä»¬èƒ½ç«‹é©¬ä½“ä¼šåˆ°Luceneçš„å¼ºå¤§åŠŸèƒ½ï¼Œä¸ºLuceneäº§å“åŒ–èµ°å‡ÞZº†ä¸€å¤§æ¥ã€?br />
Solråˆ†è¯åŽŸç†æ¼”ç¤ºç•Œé¢

[æ¸Šæº]æœ€åˆï¼ŒCNET Networksä½¿ç”¨Lucene APIæ¥å¼€å‘äº†ä¸€äº›åº”ç”¨ï¼Œòq¶åœ¨˜q™ä¸ªåŸºç¡€ä¸Šäñ”ç”Ÿäº†Solrçš„é›å½¢ï¼ŒåŽæ¥Apache Software Foundationåœ¨Lucene™å¶çñ”™å¹ç›®çš„æ”¯æŒä¸‹å¾—åˆ°äº†SolråQŒè¿™å·²ç»æ˜?006òq?æœˆä†¾çš„äº‹äº†ã€?006òq?æœ?7æ—¥ï¼ŒSolræ£æ˜¯åŠ å…¥ApacheåŸºé‡‘ä¼šçš„åµåŒ–™å¹ç›®åQŒåœ¨æ•´ä¸ª™å¹ç›®åµåŒ–æœŸé—´åQŒSolr ½EÏx¥åœ°ç§¯ç´¯å„¿Uç‰¹æ€§åÆˆå¸å¼•äº†ä¸€ä¸ªç¨³å®šçš„user¾Ÿ¤ä½“ã€developer¾Ÿ¤ä½“å’ŒCommitter¾Ÿ¤ä½“åQŒåÆˆäº?òq´ä¹‹åŽçš„17æ—¥æ£å¼é…é…¿æˆç†Ÿï¼Œåœ¨è¿™ä¹‹å‰å·²ç»æˆåŠŸå‘å¸ƒäº?.1.0ç‰ˆã€‚ç›®å‰çš„½E›_®šç‰ˆæœ¬æ˜?.2åQŒSolråœ?æœˆä†¾çš?007Apacheòq´ä¼šä¸Šå¤§æ”‘Ö¼‚å½©ï¼Œåœ¨ä»Šòq?1æœˆåº•ž®†æ¥åˆ°é¦™æ¸¯å‚åŠ?007äºšæ´²å¼€æºèÊYä»¶å³°ä¼šï¼Œé—æ†¾çš„æ˜¯ä¸ÞZ»€ä¹ˆä¸æ¥åŒ—äº?-(

[åˆè¯†Solr]SolræœåŠ¡å™¨ä¸åŒäºŽæ™®é€šçš„å…³ç³»åž‹æ•°æ®åº“åQŒä¸ä»…ä»…åœ¨äºŽå®ƒæ ¸å¿ƒæœ¬è´¨çš„ä¸åŒåQˆé¢å‘ç»“æž„åŒ–å’Œéž¾l“æž„åŒ–æ•°æ®çš„ä¸åŒåQ‰ï¼Œå¾ˆå¤§çš„ä¸åŒè¿˜åœ¨äºŽå®ƒçš„ä½“ç³»æž¶æž„ä¸Šã€‚SolræœåŠ¡å™¨ä¸€èˆ¬æƒ…å†µä¸‹éœ€è¦éƒ¨¾|²äºŽåº”ç”¨æœåŠ¡å™?Javaå®¹å™¨ä¸Šï¼ˆå¦‚æžœæ˜¯æœ¬æœºé€šä¿¡ä¸æ¶‰åŠRPCå¯ä»¥ä¸ä‹Éç”¨Javaå®¹å™¨åQŒå¦‚é‡‡ç”¨åµŒå…¥æ–¹å¼ä½¿ç”¨SolråQ‰ï¼Œæ— æ³•ç‹¬ç«‹å·¥ä½œäºŽJVMä¸Šã€?br />
Solræž¶æž„å›?/strong>
SolræœåŠ¡å™¨å¯ä»¥å˜å‚¨æ•°æ®åÆˆé€šè¿‡ç´¢å¼•å¯¹å…¶˜q›è¡Œå¿«é€Ÿé«˜æ•ˆæ£€ç´¢ã€‚å¯¹å¤–æä¾›HTTP/XMLå’ŒJson APIæŽ¥å£åQŒè¿™ä½¿å¾—å®ƒèƒ½å¤Ÿåœ¨å¤šè¯a€çŽ¯å¢ƒä¸‹é›†æˆï¼Œæ¯”å¦‚é’ˆå¯¹å®ƒçš„å®¢æˆ·ç«¯çš„å¼€å‘ã€‚Solrç›®å‰çš„å®¢æˆïL«¯é¢å‘çš„æœ‰Javaã€PHPã€Pythonã€C#ã€Jsonå’ŒRuby½{‰ï¼Œé—æ†¾çš„æ˜¯æ²¡æœ‰é¢å‘C/C++åQˆè¿™ä¹Ÿæ˜¯æœ¬ähç›®å‰åœ¨ç ”½I¶çš„åQ‰ï¼Œç ”ç©¶éŸ³ä¹æœçƒ¦åˆ†ç±»çš„Brian Whitmanæ›‘Öœ¨è‹ÒŽžœòq›_°ä¸Šä‹Éç”¨JNIæŠ€æœ¯åœ¨Cä»£ç ä¸åµŒå…¥Solrå®žçŽ°‹‚€ç´¢ï¼Œä¸è¿‡æ˜¯ä¸€ä¸ªCocoaå·¥ç¨‹ã€‚æœ‰äº†è¿™äº›å®¢æˆïL«¯åQŒä‹Éç”¨è€…èƒ½å¾ˆæ–¹ä¾¿åœ°ž®†Solré›†æˆåˆ°å…·ä½“è¿ç”¨ä¸ã€‚ç›®å‰æœ€å®Œå–„çš„å½“å±žJavaå®¢æˆ·ç«¯SolrjåQŒä»¥åŠåŠ å…¥åˆ°Solr trunkåQŒåÆˆž®†åœ¨1.3ç‰ˆæœ¬ä¸æ£å¼å‘å¸ƒã€?/span>

å¦‚æžœä¸ç ”½I¶å¼€å‘SolråQŒåªæ˜¯ä‹Éç”¨SolråQŒåªéœ€è¦å…³æ³¨Solrçš„ä»¥ä¸‹å‡ ä¸ªæ–¹é¢ï¼š
1ã€SolræœåŠ¡å™¨çš„é…ç½®åœ¨solrconfig.xmlä¸å®Œæˆï¼ŒåŒ…æ‹¬å¯¹ç¼“å˜ï¼Œservletçš„ä¸ªæ€§åŒ–é…ç½®½{‰ç‰åQŒå³¾pÈ»Ÿå…¨å±€çš„é…¾|®ï¼›
2ã€çƒ¦å¼•æ–¹æ³•ã€çƒ¦å¼•åŸŸåQˆå—ŒDµï¼‰½{‰ç‰åœ¨schema.xmlä¸å®Œæˆï¼Œ˜q™ä¸ªé…ç½®æ˜¯é’ˆå¯¹Solrå®žä¾‹çš„ï¼›
3ã€çƒ¦å¼•æ•°æ®æ–‡ä»‰™»˜è®¤æ”¾åœ¨Solræ–‡æ¡£æ ¹ç›®å½•ä¸‹çš„data/indexç›®å½•ä¸‹ï¼Œ˜q™ä¸ªè·¯å¾„å¯ä»¥é€šè¿‡½W?ç‚šw…¾|®ï¼ŒåŒæ—¶å¯ä»¥ž®†è¿™ä¸ªç›®å½•ä¸‹çš„æ–‡ä»¶è¿›è¡Œå¤åˆ¶ç²˜è´ß_¼Œå›_¯å®Œæˆç´¢å¼•çš„å¤ç”¨ï¼›
4ã€å¾ç«‹çƒ¦å¼•çš„æ—‰™—´ç›¸å½“é•¿ï¼Œæˆ‘é‡‡ç”¨æŒ‰è¯æ— å—å…¸ç´¢å¼•æ–¹å¼å¯?G110ä¸‡æ¡ä¸æ–‡è®°å½•˜q›è¡Œç´¢å¼•åQŒèŠ±äº†å°†˜q?ä¸ªåŠž®æ—¶çš„æ—¶é—ß_¼ˆå½“ç„¶˜q™ä¸ªæ—‰™—´å’Œå¾ˆå¤šå› ç´ æœ‰å…»I¼Œæœ‰å…´‘£çš„è¯å¤§å®¶å¯ä»¥ç•™a€å’Œæˆ‘è®¨è®ºåQ‰ï¼Œç›¸å¯¹è€Œè¨€åQŒåœ¨linuxä¸‹å¾ç´¢å¼•æ—‰™—´è¦æ¯”windowsä¸‹å¿«å¾ˆå¤šåQŒå¯ä»¥ä‹Éç”¨commitæ“ä½œä½¿æ–°å¢žçƒ¦å¼•ç”Ÿæ•ˆï¼ŒåŒæ—¶æ³¨æ„ç´¢å¼•çš„ä¼˜åŒ–ï¼Œç´¢å¼•ä¼˜åŒ–ä¹Ÿæ˜¯å¾ˆè´¹èµ„æºå’Œæ—¶é—´çš„åQŒä½†æ˜¯ä¼˜åŒ–çƒ¦å¼•ä¹Ÿæ˜¯æé«˜æ£€ç´¢é€Ÿåº¦çš„é‡è¦æ–¹æ³•ï¼Œå› æ¤éœ€è¦å¥½å¥½æƒè¡¡è¿™ä¸€ç‚¹ï¼›
5ã€å®‰è£…å®ŒåŽçš„Solrç›®å½•ä¸‹æœ‰˜q™ä¹ˆå‡ ä¸ªæ–‡äšgå¤¹ï¼šbinæ–‡äšgå¤šw‡Œä¸»è¦æ˜¯ç”¨äºŽå¾ç«‹é•œåƒå’Œå®Œæˆ˜qœç¨‹åŒæ¥çš„è„šæœ¬ï¼›confæ–‡äšgå¤¹ä¸‹ä¸»è¦æ˜?ã€?ç‚¹ä¸æåˆ°çš„é…¾|®æ–‡ä»Óž¼›adminæ–‡äšgå¤¹ä¸‹æ˜¯çš„ä¸»è¦æ˜¯æä¾›web½Ž¡ç†ç•Œé¢çš„æ–‡ä»Óž¼›
6ã€ç›®å‰Solr1.2ä¸å…·å¤‡å®‰å…¨æ€§è®¾è®¡ï¼Œæ²¡æœ‰ç”¨æˆ·¾l„åŠæƒé™è®„¡½®åQŒåœ¨˜q›è¡Œå…·ä½“åº”ç”¨æ—‰™œ€è¦æ³¨æ„å®‰å…¨ï¼Œç›®å‰æœ€æœ‰æ•ˆçš„æ–¹æ³•æ˜¯é€šè¿‡åº”ç”¨æœåŠ¡å™¨ä¸Šçš„æŽˆæƒå®žçŽ°ã€?br /> æœ¬æ–‡æ°æ€¹…é“¾æŽ¥åQ?a >http://www.jinsehupan.com/blog/?p=25

[Solrçš„å®‰è£?/span>]Solrå‘è¡Œç‰ˆä¸å·²ç»æœ‰ä¸€ä¸ªä‹Éç”¨Jettyä¸ºservletå®¹å™¨çš„å°ä¾‹ååQŒå¯ä»¥ä‹Éç”¨è¿™ä¸ªä¾‹åæ¥ä½“éªŒåQŒé‚£æ£åœ¨åœ¨è‡ªå·±æƒ³éƒ¨çÖvçš„åã^å°å’Œåº”ç”¨æœåŠ¡å™¨ä¸Šè¯¥æ€Žä¹ˆä¸€ä¸ªæ¥éª¤å‘¢åQ?/span>

è¦å¼€å§‹ä‹Éç”?SolråQŒéœ€å®‰è£…ä»¥ä¸‹è½¯äšgåQ?br /> 1ã€Java 1.5 æˆ–æ›´é«˜ç‰ˆæœ¬ï¼›
2ã€Ant 1.6.x æˆ–æ›´é«˜ç‰ˆæœ¬ï¼ˆç”¨äºŽ¾~–è¯‘½Ž¡ç†Solrå·¥ç¨‹åQŒä¸ªäººæŽ¨èï¼Œå½“ç„¶å¯ä»¥ä½¿ç”¨eclipseåQ‰ï¼›
3ã€Web ‹¹è§ˆå™¨ï¼Œç”¨æ¥æŸ¥çœ‹½Ž¡ç†™åµé¢åQˆå®˜æ–¹å¾è®®ä‹Éç”¨FirefoxåQŒä½†å®žé™…æ²¡æœ‰å‘çŽ°å’ŒIEæœ‰ä»€ä¹ˆå·®åˆ«ï¼‰åQ?br /> 4ã€servlet å®¹å™¨åQŒå¦‚Tomcat 5.5åQˆä¸å»ø™®®ä½¿ç”¨6ç‰ˆæœ¬åQ‰ã€‚æœ¬æ–‡ä»¥Tomcat åœ?8080 ç«¯å£ä¸Šè¿è¡ŒäØ“ä¾‹ã€‚å¦‚æžœè¿è¡Œçš„æ˜¯å…¶ä»?servlet å®¹å™¨æˆ–åœ¨å…¶ä»–çš„ç«¯å£ä¸Š˜qè¡ŒåQŒåˆ™å¯èƒ½è¦ä¿®æ”¹ä»£ç ä¸çš„URLæ‰èƒ½è®‰K—®½CÞZ¾‹åº”ç”¨½E‹åºå’?Solrã€?/span>

ä¸‹é¢å¼€å§‹å®‰è£…é…¾|®ï¼š

1ã€ä‹Éç”¨Ant¾~–è¯‘å·¥ç¨‹æˆ–ä¸‹è½½ç¤ºä¾‹åº”ç”¨ç¨‹åºï¼Œž®†Solr WAR æ–‡äšgå¤åˆ¶åˆ?servlet å®¹å™¨çš„webappsç›®å½•ä¸ï¼›
2ã€å¾—åˆ°Solræ–‡äšgå¤¹ï¼Œä»¥å¤‡éšåŽž®†å…¶å¤åˆ¶åˆ°å½“å‰ç›®å½•ï¼Œå¯ä»¥ä½¿ç”¨ant buildå¾—åˆ°åQŒä¹Ÿå¯ä»¥åœ¨ä¸‹è½½çš„åŽ‹ç¾ƒåŒ…ä¸æ‰‘Öˆ°åQŒä»¥å®ƒäØ“æ¨¡æ¿ä»¥å¤‡ä¹‹åŽçš„ä¿®æ”¹ï¼›
3ã€å¯ä»¥é€šè¿‡ä»¥ä¸‹ä¸‰ç§æ–¹å¼ä¹‹ä¸€è®„¡½® Solr çš„ä¸»ä½ç½®åQ?br /> è®„¡½® java ¾pÈ»Ÿå±žæ€?solr.solr.home åQˆæ²¡é”™ï¼Œž®±æ˜¯ solr.solr.homeåQŒä¸€èˆ¬åœ¨åµŒå…¥å¼é›†æˆä¸ç”¨å¾—å¤šï¼‰åQ?br /> é…ç½® java:comp/env/solr/home çš„ä¸€ä¸?JNDI æŸ¥æ‰¾æŒ‡å‘ solr ç›®å½•åQŒå¾ç«?tomcat55/conf/Catalina/localhost/solr.xmlæ–‡äšgåQŒæ³¨æ„è¿™ä¸ªxmlæ–‡äšgåå°†æ˜¯Solrå®žä¾‹åç§°åQ?ä¸çš„å½“å‰ç›®å½•è¢«æŒ‡å®šäØ“ä¸‹é¢ä¸çš„f:/solrhomeåQŒæ–‡ä»¶å†…å®¹å¦‚ä¸‹ï¼š



åœ¨åŒ…å?solr ç›®å½•çš„ç›®å½•ä¸å¯åŠ¨ servlet å®¹å™¨åQˆé»˜è®¤çš„ Solr ä¸È›®å½•æ˜¯å½“å‰å·¥ä½œç›®å½•ä¸‹çš„ solråQ‰ï¼›
4ã€æœ€åŽä¸€ç‚¹å°±æ˜¯å¦‚æžœæœ‰CJKåQˆä¸æ—¥éŸ©æ–‡å—åQ‰åº”ç”¨ï¼Œå‡ºçŽ°ä¹Þq é—®é¢˜åQŒé‡‡ç”¨å¦‚ä¸‹æ–¹æ³•è§£å†»I¼ˆå…¶å®žå·²ç»ä¸ç®—æ˜¯solré…ç½®é—®é¢˜åQŒè€Œæ˜¯åº”ç”¨æœåŠ¡å™¨é…¾|®é—®é¢˜ï¼‰åQŒä¿®æ”¹Tomcatçš„conf/server.xmlæ–‡äšgä¸å¯¹äºŽç«¯å£ï¼ˆæœ¬æ–‡ä¸?080åQ‰çš„˜qžæŽ¥å™¨ç»Ÿä¸€èµ„æº¾~–ç ä¸ºUTF-8åQŒå› ä¸ºSolr1.2å†…æ ¸æ”¯æŒUTF-8¾~–ç åQ?/span>


   ...

[Solråˆ†è¯™åºåº]Solrå»ºç«‹ç´¢å¼•å’Œå¯¹å…³é”®è¯è¿›è¡ŒæŸ¥è¯¢éƒ½å¾—å¯¹å—ä¸²˜q›è¡Œåˆ†è¯åQŒåœ¨å‘çƒ¦å¼•åº“ä¸æ·»åŠ å…¨æ–‡æ£€ç´¢ç±»åž‹çš„ç´¢å¼•çš„æ—¶å€™ï¼ŒSolrä¼šé¦–å…ˆç”¨½Iºæ ¼˜q›è¡Œåˆ†è¯åQŒç„¶åŽæŠŠåˆ†è¯¾l“æžœä¾æ¬¡ä½¿ç”¨æŒ‡å®šçš„è¿‡æ»¤å™¨˜q›è¡Œ˜q‡æ×oåQŒæœ€åŽå‰©ä¸‹çš„¾l“æžœæ‰ä¼šåŠ å…¥åˆ°çƒ¦å¼•åº“ä¸ä»¥å¤‡æŸ¥è¯¢ã€‚åˆ†è¯çš„™åºåºå¦‚ä¸‹åQ?br /> ç´¢å¼•
1åQšç©ºæ ¼whitespaceTokenize
2åQšè¿‡æ»¤è¯StopFilter
3åQšæ‹†å—WordDelimiterFilter
4åQšå°å†™è¿‡æ»¤LowerCaseFilter
5åQšè‹±æ–‡ç›¸˜q‘è¯EnglishPorterFilter
6åQšåŽ»é™¤é‡å¤è¯RemoveDuplicatesTokenFilter
æŸ¥è¯¢
1åQšæŸ¥è¯¢ç›¸˜q‘è¯
2åQšè¿‡æ»¤è¯
3åQšæ‹†å?br /> 4åQšå°å†™è¿‡æ»?br /> 5åQšè‹±æ–‡ç›¸˜q‘è¯
6åQšåŽ»é™¤é‡å¤è¯
ä»¥ä¸Šæ˜¯é’ˆå¯¹è‹±æ–‡ï¼Œä¸æ–‡çš„é™¤äº†ç©ºæ û|¼Œå…¶ä»–éƒ½ç±»ä¼?/span>

[Solrä¸æ–‡åº”ç”¨çš„ä¸€ä¸ªå®žä¾?/span>]
1ã€é¦–å…ˆé…¾|®schema.xmlåQŒè¿™ä¸ªç›¸å½“äºŽæ•°æ®è¡¨é…¾|®æ–‡ä»Óž¼Œå®ƒå®šä¹‰äº†åŠ å…¥ç´¢å¼•çš„æ•°æ®çš„æ•°æ®¾cÕdž‹çš„ã€?.2ç‰ˆæœ¬çš„schema.xmlä¸»è¦åŒ…æ‹¬typesã€fieldså’Œå…¶ä»–çš„ä¸€äº›ç¼ºçœè®¾¾|®ã€?/span>

Aã€é¦–å…ˆéœ€è¦åœ¨types¾l“ç‚¹å†…å®šä¹‰ä¸€ä¸ªFieldTypeåç»“ç‚¹ï¼ŒåŒ…æ‹¬name,class,positionIncrementGap½{‰ç‰ä¸€äº›å‚æ•ŽÍ¼Œnamež®±æ˜¯˜q™ä¸ªFieldTypeçš„å¿UŽÍ¼ŒclassæŒ‡å‘org.apache.solr.analysisåŒ…é‡Œé¢å¯¹åº”çš„classåç§°åQŒç”¨æ¥å®šä¹‰è¿™ä¸ªç±»åž‹çš„è¡ŒäØ“ã€‚åœ¨FieldTypeå®šä¹‰çš„æ—¶å€™æœ€é‡è¦çš„å°±æ˜¯å®šä¹‰è¿™ä¸ªç±»åž‹çš„æ•°æ®åœ¨å¾ç«‹çƒ¦å¼•å’Œ˜q›è¡ŒæŸ¥è¯¢çš„æ—¶å€™è¦ä½¿ç”¨çš„åˆ†æžå™¨analyzer,åŒ…æ‹¬åˆ†è¯å’Œè¿‡æ»¤ã€‚åœ¨ä¾‹åä¸text˜q™ä¸ªFieldTypeåœ¨å®šä¹‰çš„æ—¶å€™ï¼Œåœ¨indexçš„analyzerä¸ä‹Éç”¨solr.WhitespaceTokenizerFactory˜q™ä¸ªåˆ†è¯åŒ…ï¼Œž®±æ˜¯½Iºæ ¼åˆ†è¯åQŒç„¶åŽä‹Éç”¨solr.StopFilterFactoryåQŒsolr.WordDelimiterFilterFactoryåQŒsolr.LowerCaseFilterFactoryåQŒsolr.EnglishPorterFilterFactoryåQŒsolr.RemoveDuplicatesTokenFilterFactory˜q™å‡ ä¸ªè¿‡æ»¤å™¨ã€‚åœ¨å‘çƒ¦å¼•åº“ä¸æ·»åŠ text¾cÕdž‹çš„çƒ¦å¼•çš„æ—¶å€™ï¼ŒSolrä¼šé¦–å…ˆç”¨½Iºæ ¼˜q›è¡Œåˆ†è¯åQŒç„¶åŽæŠŠåˆ†è¯¾l“æžœä¾æ¬¡ä½¿ç”¨æŒ‡å®šçš„è¿‡æ»¤å™¨˜q›è¡Œ˜q‡æ×oåQŒæœ€åŽå‰©ä¸‹çš„¾l“æžœæ‰ä¼šåŠ å…¥åˆ°çƒ¦å¼•åº“ä¸ä»¥å¤‡æŸ¥è¯¢ã€‚Solrçš„analysisåŒ…åÆˆæ²¡æœ‰å¸¦æ”¯æŒä¸æ–‡çš„åŒ…ï¼Œåœ¨è¿™é‡Œæˆ‘ä»¬é‡‡ç”¨luceneé‡Œçš„è¯è¨€åŒ…ï¼ˆåœ¨ä¸‹è½½åŽçš„solråŽ‹ç¾ƒåŒ…å†…åQŒlibç›®å½•ä¸‹æœ‰ä¸€ä¸ªlucene-analyzers-2.2.0.jaråŒ…ï¼Œé‡Œé¢å«æœ‰ä¸æ–‡å¤„ç†çš„cnå’Œcjk¾c»ï¼‰åQŒæœ‰cnå’Œcjkä¸¤ä¸ª¾cÕd¯ä»¥æ”¯æŒä¸æ–‡ã€‚æˆ‘ä»¬é‡‡ç”¨cjk¾c»ï¼Œòq¶åœ¨schema.xmlä¸åŠ å…¥å¦‚ä¸‹é…¾|®ï¼š




æ”¯æŒ¾cÕdž‹å®šä¹‰å®Œæˆäº†ã€?/span>

Bã€æŽ¥ä¸‹æ¥çš„å·¥ä½œå°±æ˜¯åœ¨fields¾l“ç‚¹å†…å®šä¹‰å…·ä½“çš„å—æ®µåQˆç±»ä¼¼æ•°æ®åº“ä¸çš„å—æ®µåQ‰ï¼Œž®±æ˜¯filedåQŒfiledå®šä¹‰åŒ…æ‹¬name,typeåQˆäØ“ä¹‹å‰å®šä¹‰˜q‡çš„å„ç§FieldTypeåQ?indexedåQˆæ˜¯å¦è¢«ç´¢å¼•åQ?storedåQˆæ˜¯å¦è¢«å‚¨å˜åQ‰ï¼ŒmultiValuedåQˆæ˜¯å¦æœ‰å¤šä¸ªå€û|¼‰½{‰ç‰ã€‚ä¾‹å¦‚å®šä¹‰å¦‚ä¸‹ï¼š

è®°å½•å?/span>" type="slong" indexed="true" stored="true" required="true" />
   æ–‡äšgå?/span>" type="string" indexed="true" stored="true" />
   æ—¥æœŸ" type="date" indexed="true" stored="true" />
   ç‰ˆæ¬¡" type="string" indexed="true" stored="true" multiValued="true"/>
   æ ç›®" type="string" indexed="true" stored="true" multiValued="true"/>
   æ ‡é¢˜" type="text_cjk" indexed="true" stored="true" multiValued="true"/>
   ä½œè€?/span>" type="text_cjk" indexed="true" stored="true" multiValued="true"/>
   æ£æ–‡" type="text_cjk" indexed="true" stored="true" multiValued="true"/>
   æ ‡è®°" type="text_cjk" indexed="true" stored="true" multiValued="true"/>

fieldçš„å®šä¹‰ç›¸å½“é‡è¦ï¼Œæœ‰å‡ ä¸ªæŠ€å·§éœ€æ³¨æ„ä¸€ä¸‹ï¼Œå¯¹å¯èƒ½å˜åœ¨å¤šå€¼å¾—å—æ®µž®½é‡è®„¡½®multiValuedå±žæ€§äØ“trueåQŒé¿å…å¾ç´¢å¼•æ˜¯æŠ›å‡ºé”™è¯¯ï¼›å¦‚æžœä¸éœ€è¦å˜å‚¨ç›¸åº”å—ŒDµå€û|¼Œž®½é‡ž®†storedå±žæ€§è®¾ä¸ºfalseã€?/span>

Cã€å¾è®®å¾ç«‹äº†ä¸€ä¸ªæ‹·è´å—ŒDµï¼Œž®†æ‰€æœ‰çš„å…¨æ–‡å—æ®µå¤åˆ¶åˆîC¸€ä¸ªå—ŒDµä¸åQŒä»¥ä¾¿è¿›è¡Œç»Ÿä¸€çš„æ£€ç´¢ï¼š

òq¶åœ¨æ‹¯‚´å—æ®µ¾l“ç‚¹å¤„å®Œæˆæ‹·è´è®¾¾|®ï¼š

æ ‡é¢˜" dest="text_com"/>
   æ£æ–‡" dest="text_com"/>

Dã€é™¤æ¤ä¹‹å¤–ï¼Œ˜q˜å¯ä»¥å®šä¹‰åŠ¨æ€å—ŒDµï¼Œæ‰€è°“åŠ¨æ€å—ŒDµå°±æ˜¯ä¸ç”¨æŒ‡å®šå…·ä½“çš„åç§°åQŒåªè¦å®šä¹‰å—ŒDµå¿U°çš„è§„åˆ™åQŒä¾‹å¦‚å®šä¹‰ä¸€ä¸ªdynamicFieldåQŒnameä¸?_iåQŒå®šä¹‰å®ƒçš„typeä¸ºtextåQŒé‚£ä¹ˆåœ¨ä½¿ç”¨˜q™ä¸ªå—æ®µçš„æ—¶å€™ï¼Œä»ÖM½•ä»¥_i¾l“å°¾çš„å—ŒDµéƒ½è¢«è®¤ä¸ºæ˜¯½W¦åˆ˜q™ä¸ªå®šä¹‰çš„ï¼Œä¾‹å¦‚name_iåQŒgender_iåQŒschool_i½{‰ã€?/span>

2ã€é…¾|®solrconfig.xmlåQŒç”¨æ¥é…¾|®Solrçš„ä¸€äº›ç³»¾lŸå±žæ€§ï¼Œæ¯”è¾ƒé‡è¦çš„ä¸€ä¸ªå°±æ˜¯å¯ä»¥é€šè¿‡æ›´æ”¹å…¶ä¸çš„dataDirå±žæ€§æ¥æŒ‡å®šç´¢å¼•æ–‡äšgçš„å˜æ”¾ä½¾|®ï¼Œå¯¹äºŽæœ‰å¤§æ•°æ®é‡çš„æƒ…å†µä¸‹è¿˜è¦è¿›è¡Œè‡ªåŠ¨commitæ“ä½œé…ç½®åQŒä»¥ä¸‹è®¾¾|®äØ“å½“å†…å˜çƒ¦å¼•é‡è¾‘Öˆ°20Wæ¡æ—¶è‡ªåŠ¨˜q›è¡Œå¾€¼‚ç›˜å†™æ“ä½œï¼Œä»¥å…å †æº¢å‡ºï¼Œ˜q™ä¹Ÿæ˜¯è§£å†›_•ä¸ªå…¥åº“xmlæ–‡äšgæœ€å¥½ä¸è¦è¶…˜q?0Mçš„æœ‰æ•ˆæ–¹æ³•ï¼š

   200000

3ã€é…¾|®å¥½˜q™äº›åŽï¼Œéœ€è¦é‡æ–°å¯åŠ¨SolræœåŠ¡å™¨ä‹Éé…ç½®ç”Ÿæ•ˆåQŒç„¶åŽå‘å…¶ä¸æ·ÕdŠ æ•°æ®ã€?/span>

4ã€æ·»åŠ æ•°æ®æ˜¯é€šè¿‡å‘æœåŠ¡å™¨çš„update Servlet POST xmlæ ¼å¼çš„æ•°æ®æ¥å®žçŽ°çš„ï¼Œxml¾l“æž„æ˜¯è¿™æ ïLš„addä¸é—´æœ‰å¾ˆå¤šä¸ªdocåQŒæ¯ä¸ªdocä¸æœ‰å¾ˆå¤šä¸ªfieldã€‚æ·»åŠ åˆ°ç´¢å¼•åº“ä¸çš„æ¯æ¡è®°å½•éƒ½å¿…é¡»æŒ‡å®šå”¯ä¸€çš„æ•°å—idæ¥å”¯ä¸€æ ‡è¯†˜q™æ¡ç´¢å¼•ã€‚å¾ç«‹å¥½xmlæ–‡äšgåQˆä¾‹å¦‚solr.xmlåQ‰ä¹‹åŽï¼Œåœ¨exampledocsç›®å½•ä¸‹æ‰§è¡Œï¼šjava -jar post.jar solr.xmlæ¥æ·»åŠ çƒ¦å¼•æ•°æ®ã€‚å¯¹äºŽpostçš„jaråŒ…ï¼Œå¦‚æžœé‡æ–°é…ç½®äº†åº”ç”¨æœåŠ¡å™¨åQŒå¦‚ä½¿ç”¨äº†comcatåQŒç«¯å£æ”¹ä¸?080åQŒå®žä¾‹å¿U°æ”¹ä¸ºsolrxäº†éœ€è¦é‡æ–°ç”Ÿæˆç›¸åº”çš„post.jaråŒ…è¿›è¡Œæ“ä½œã€?/span>

å¦é™„ronghaoå®žçŽ°ä¸æ–‡åˆ†è¯çš„æ¡ˆä¾‹ä¾›å¤§å®¶å‚è€ƒï¼š

å¯¹å…¨æ–‡æ£€ç´¢è€Œè¨€åQŒä¸æ–‡åˆ†è¯éžå¸¸çš„é‡è¦åQŒè¿™é‡Œé‡‡ç”¨äº†qieqieåº–ä¸åˆ†è¯åQˆéžå¸æ€¸é”™ï¼šåQ‰ï¼‰ã€‚é›†æˆéžå¸¸çš„å®ÒŽ˜“åQŒæˆ‘ä¸‹è²çš„æ˜¯2.0.4-alpha2ç‰ˆæœ¬åQŒå…¶ä¸å®ƒæ”¯æŒæœ€å¤šåˆ‡åˆ†å’ŒæŒ‰æœ€å¤§åˆ‡åˆ†ã€‚åˆ›å»ø™‡ªå·Þqš„ä¸€ä¸ªä¸æ–‡TokenizerFactory¾l§æ‰¿è‡ªsolrçš„BaseTokenizerFactoryã€?/span>

**

* Created by IntelliJ IDEA.

* User: ronghao

* Date: 2007-11-3

* Time: 14:40:59

* ä¸æ–‡åˆ‡è¯ å¯¹åº–ä¸åˆ‡è¯çš„ž®è£…

*/

public class ChineseTokenizerFactory extends BaseTokenizerFactory {

/**

* æœ€å¤šåˆ‡åˆ?é»˜è®¤æ¨¡å¼

*/

public static final String MOST_WORDS_MODE = “most-words”;

/**

* æŒ‰æœ€å¤§åˆ‡åˆ?/span>

*/

public static final String MAX_WORD_LENGTH_MODE = “max-word-length”;

private String mode = null;

public void setMode(String mode) {

if (mode==null||MOST_WORDS_MODE.equalsIgnoreCase(mode)

|| “default”.equalsIgnoreCase(mode)) {

this.mode=MOST_WORDS_MODE;

} else if (MAX_WORD_LENGTH_MODE.equalsIgnoreCase(mode)) {

this.mode=MAX_WORD_LENGTH_MODE;

}

else {

throw new IllegalArgumentException(”ä¸åˆæ³•çš„åˆ†æžå™¨Modeå‚æ•°è®„¡½®:” + mode);

}

}

@Override

public void init(Map args) {

super.init(args);

setMode(args.get(”mode”));

}

public TokenStream create(Reader input) {

return new PaodingTokenizer(input, PaodingMaker.make(),

createTokenCollector());

}

private TokenCollector createTokenCollector() {

if( MOST_WORDS_MODE.equals(mode))

return new MostWordsTokenCollector();

if( MAX_WORD_LENGTH_MODE.equals(mode))

return new MaxWordLengthTokenCollector();

throw new Error(”never happened”);

}

}

åœ¨schema.xmlçš„å—ŒDµtexté…ç½®é‡ŒåŠ å…¥è¯¥åˆ†è¯å™¨ã€?/span>

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

13.

14.

15.

16.

17.

18.

19.

20.

21.

22.

23.

24.

25.

26.

27.

28.

29.

30.

31.

32.

33.

34.

35.

å®ŒæˆåŽé‡å¯tomcatåQŒå³å¯åœ¨http://localhost:8080/solr/admin/analysis.jsp

ä½“éªŒåˆ°åº–ä¸çš„ä¸æ–‡åˆ†è¯ã€‚æ³¨æ„è¦ž®†paoding-analysis.jarå¤åˆ¶åˆ°solrçš„libä¸‹ï¼Œæ³¨æ„ä¿®æ”¹jaråŒ…é‡Œå—å…¸çš„homeã€?/span>

[Solrçš„æ£€ç´¢è¿½Ž—ç¬¦]
“:” æŒ‡å®šå—æ®µæŸ¥æŒ‡å®šå€û|¼Œå¦‚è¿”å›žæ‰€æœ‰å€?:*²
“?”²è¡¨ç¤ºå•ä¸ªä»ÀL„å—ç¬¦çš„é€šé…
“*” è¡¨ç¤ºå¤šä¸ªä»ÀL„å—ç¬¦çš„é€šé…åQˆä¸èƒ½åœ¨‹‚€ç´¢çš„™å¹å¼€å§‹ä‹Éç”?æˆ–è€?½W¦å·åQ?/span>²
“~”²è¡¨ç¤ºæ¨¡ç³Š‹‚€ç´¢ï¼Œå¦‚æ£€ç´¢æ‹¼å†™ç±»ä¼égºŽ”roam”çš„é¡¹˜q™æ ·å†™ï¼šroam~ž®†æ‰¾åˆ°åÅžå¦‚foamå’Œroamsçš„å•è¯ï¼›roam~0.8åQŒæ£€ç´¢è¿”å›žç›¸ä¼¼åº¦åœ?.8ä»¥ä¸Šçš„è®°å½•ã€?br /> ²é‚»è¿‘‹‚€ç´¢ï¼Œå¦‚æ£€ç´¢ç›¸éš?0ä¸ªå•è¯çš„”apache”å’?#8221;jakarta”åQ?#8221;jakarta apache”~10
“^”²æŽ§åˆ¶ç›¸å…³åº¦æ£€ç´¢ï¼Œå¦‚æ£€ç´¢jakarta apacheåQŒåŒæ—¶å¸Œæœ›åŽ»è®?#8221;jakarta”çš„ç›¸å…›_º¦æ›´åŠ å¥½ï¼Œé‚£ä¹ˆåœ¨å…¶åŽåŠ ä¸?#8221;^”½W¦å·å’Œå¢žé‡å€û|¼Œå³jakarta^4 apache
å¸ƒå°”æ“ä½œ½W¦ANDã€||²
å¸ƒå°”æ“ä½œ½W¦ORã€?/span>²&&
å¸ƒå°”æ“ä½œ½W¦NOTã€?ã€?²åQˆæŽ’é™¤æ“ä½œç¬¦ä¸èƒ½å•ç‹¬ä¸Žé¡¹ä½¿ç”¨æž„æˆæŸ¥è¯¢åQ?br /> “+” å˜åœ¨æ“ä½œ½W¦ï¼Œè¦æ±‚½W¦å·”+”åŽçš„™å¹å¿…™åÕdœ¨æ–‡æ¡£ç›¸åº”çš„åŸŸä¸å˜åœ?/span>²
( ) ç”¨äºŽæž„æˆåæŸ¥è¯?/span>²
² [] åŒ…å«èŒƒå›´‹‚€ç´¢ï¼Œå¦‚æ£€ç´¢æŸæ—‰™—´ŒDµè®°å½•ï¼ŒåŒ…å«å¤´å°¾åQŒdate:[200707 TO 200710]
{}²ä¸åŒ…å«èŒƒå›´æ£€ç´¢ï¼Œå¦‚æ£€ç´¢æŸæ—‰™—´ŒDµè®°å½•ï¼Œä¸åŒ…å«å¤´ž®?br /> date:{200707 TO 200710}
" è½¬ä¹‰æ“ä½œ½W¦ï¼Œç‰ÒŽ®Šå—ç¬¦åŒ…æ‹¬+ -² && || ! ( ) { } [ ] ^ ” ~ * ? : "

‹¹æµªæ±?/a> 2008-03-26 11:22 å‘è¡¨è¯„è®º
]]>

97色伦亚洲国产,国产精品区二区三区日本,欧美日韩久久久

Lucene/Solrå¼€å‘ç»éªŒ[è½¬è²]

Lucene/Solrå¼€å‘ç»éªŒ[è½¬è²]