ï»??xml version="1.0" encoding="utf-8" standalone="yes"?>免费精品国产,久久久久久五月天久久久久久久久,欧美久久99http://www.aygfsteel.com/libin2722/category/53383.html虚其心,å¯è§£å¤©ä¸‹ä¹‹é—®åQ›ä¸“其心åQŒå¯æ²Õd¤©ä¸‹ä¹‹å­¦ï¼›é™å…¶å¿ƒï¼Œå¯æ‚Ÿå¤©ä¸‹ä¹‹ç†åQ›æ’其心åQŒå¯æˆå¤©ä¸‹ä¹‹ä¸šã€?/description>zh-cnFri, 08 Mar 2013 06:06:42 GMTFri, 08 Mar 2013 06:06:42 GMT60ä¸ªæ€§åŒ–æŽ¨èæŠ€æœ¯æ˜Oè°?/title><link>http://www.aygfsteel.com/libin2722/articles/396041.html</link><dc:creator>½C¼ç‰©</dc:creator><author>½C¼ç‰©</author><pubDate>Mon, 04 Mar 2013 08:39:00 GMT</pubDate><guid>http://www.aygfsteel.com/libin2722/articles/396041.html</guid><wfw:comment>http://www.aygfsteel.com/libin2722/comments/396041.html</wfw:comment><comments>http://www.aygfsteel.com/libin2722/articles/396041.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.aygfsteel.com/libin2722/comments/commentRss/396041.html</wfw:commentRss><trackback:ping>http://www.aygfsteel.com/libin2722/services/trackbacks/396041.html</trackback:ping><description><![CDATA[ <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">如果说过åŽÈš„å年是æœç´¢æŠ€æœ¯å¤§è¡Œå…¶é“çš„åå¹´åQŒé‚£ä¹ˆä¸ªæ€§åŒ–æŽ¨èæŠ€æœ¯å°†æˆäؓ未æ¥å年中最é‡è¦çš„驿–îC¹‹ä¸€ã€‚ç›®å‰å‡ ä¹Žæ‰€æœ‰å¤§åž‹çš„电å­å•†åŠ¡¾pÈ»ŸåQŒå¦‚Amazonã€CDNOWã€Netflix½{‰ï¼Œéƒ½ä¸åŒç¨‹åº¦åœ°ä½¿ç”¨äº†å„¿UåÅžå¼çš„æŽ¨è¾pÈ»Ÿã€‚而近æ¥ä»¥â€œå‘现â€äؓ核心的网站正开始在互蔾|‘上崭露头角åQŒæ¯”如侧é‡äºŽéŸ³ä¹æŽ¨è的八å®ç›’åQŒä¾§é‡äºŽå›¾ä¹¦æŽ¨è的豆瓣等½{‰ã€?/div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">那么åQŒä¸€ä¸ªå¥½çš„æŽ¨èç³»¾lŸéœ€è¦æ»¡­‘³ä»€ä¹ˆç›®æ ‡å‘¢åQ?br style="margin: 0px; padding: 0px;" />个性化推è¾pÈ»Ÿå¿…须能够åŸÞZºŽç”¨æˆ·ä¹‹å‰çš„å£å‘›_’Œå–œå¥½æä¾›ç›¸å…³çš„ç²¾¼‹®çš„æŽ¨èåQŒè€Œä¸”˜q™ç§å£å‘³å’Œå–œ‹Æ¢çš„æ”‰™›†å¿…é¡»ž®½é‡ž®‘的需è¦ç”¨æˆïLš„力_Š¨ã€‚æŽ¨èçš„¾l“果必须能够实时计算åQŒè¿™æ äh‰èƒ½å¤Ÿåœ¨ç”¨æˆïL¦»å¼€¾|‘ç«™å‰ä¹‹å‰èŽ·å¾—æŽ¨è的内容åQŒåÆˆä¸”åŠæ—¶çš„å¯ÒŽŽ¨è结果作出å馈。实时性也是推èç³»¾lŸä¸Žé€šå¸¸çš„æ•°æ®æŒ–掘技术显著ä¸åŒçš„一个特ç‚V€?/div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">一个完整的推è¾pÈ»Ÿç”׃¸‰éƒ¨åˆ†æž„æˆåQšè¡Œä¸ø™®°å½•模å—ã€æ¨¡åž‹åˆ†æžæ¨¡å—å’ŒæŽ¨èæ¨¡å—ã€‚è¡Œä¸ø™®°å½•模å—è´Ÿè´£è®°å½•èƒ½å¤Ÿä½“çŽ°ç”¨æˆ·å–œå¥½çš„è¡ŒäØ“åQŒæ¯”如购买ã€ä¸‹è½½ã€è¯„分等。这部分看è“væ¥ç®€å•,其实需è¦éžå¸æ€»”¾l†çš„设计。比如说购买和评分这两ç§è¡Œäؓ表达潜在的喜好程度就ä¸å°½ç›¸åŒå®Œå–„çš„è¡Œä¸ø™®°å½•需è¦èƒ½å¤Ÿç»¼åˆå¤š¿Uä¸åŒçš„ç”¨æˆ·è¡ŒäØ“åQŒå¤„ç†ä¸åŒè¡Œä¸ºçš„ç´¯åŠ ã€‚æ¨¡åž‹åˆ†æžæ¨¡å—的功能则实çŽîCº†å¯¹ç”¨æˆ¯‚¡Œä¸ø™®°å½•的分æžåQŒé‡‡ç”¨ä¸åŒç®—法å¾ç«‹è“v模型æè¿°ç”¨æˆ·çš„喜好信æ¯ã€‚最åŽï¼Œé€šè¿‡æŽ¨è模å—åQŒå®žæ—¶çš„从内定w›†½{›é€‰å‡ºç›®æ ‡ç”¨æˆ·å¯èƒ½ä¼šæ„Ÿå…´è¶£çš„内å®ÒŽŽ¨è给用户。因此,除了推è¾pÈ»Ÿæœ¬èínåQŒäؓ了实现推è,˜q˜éœ€è¦ä¸€ä¸ªå¯ä¾›æŽ¨èçš„å†…å®¹é›†ã€‚æ¯”å¦‚ï¼Œå¯¹äºŽéŸ³ä¹æŽ¨è¾pÈ»Ÿæ¥è¯´åQŒä¸€ä¸ªéŸ³ä¹åº“ž®±æ˜¯˜q™æ ·çš„内定w›†ã€‚我们对内容集本íw«éœ€è¦æä¾›çš„ä¿¡æ¯è¦æ±‚éžå¸¸ä½Žï¼Œåœ¨ç»å…¸çš„å匘q‡æ×o½Ž—法下,内容集甚臛_ªéœ€è¦æä¾›IDž®Þpƒö够。而对于基于内容的推è¾pÈ»Ÿæ¥è¯´åQŒç”±äºŽå¾€å¾€éœ€è¦å¯¹å†…容˜q›è¡Œç‰¹å¾æŠ½å–和烦引,我们ž®×ƒ¼šéœ€è¦æä¾›æ›´å¤šçš„领域知识和内容属性。这¿U情况下åQŒè¿˜æ˜¯æ‹¿éŸ³ä¹ä¸¾ä¾‹åQŒæ­Œæ‰‹ã€æµ‹z¾ä¹‹¾cÈš„属性和音频信毞®±æˆä¸ºå¿…需的内定w›†ä¿¡æ¯ã€?br style="margin: 0px; padding: 0px;" /><br style="margin: 0px; padding: 0px;" /></div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">˜q„今为止在个性化推è¾pÈ»Ÿä¸­ï¼Œå匘q‡æ×oåQˆCollaborative FilteringåQ‰æŠ€æœ¯æ˜¯åº”用最æˆåŠŸçš„æŠ€æœ¯ã€‚ç›®å‰å›½å†…外互蔾|‘上有许多大型网站已¾l应用这™åÒŽŠ€æœ¯äØ“ç”¨æˆ·æ›´åŠ æ™ø™ƒ½çš„æŽ¨è内å®V€‚如果你惌™¦ç ”ç©¶å匘q‡æ×oåQŒä¸€å®šä¸èƒ½é”™˜q‡MovieLensåQ?a style="margin: 0px; padding: 0px; color: rgb(51, 102, 153); text-decoration: none;">http://movielens.umn.edu/</a>åQ‰ã€‚它是ååŒè¿‡æ»¤æœ€è‘—å的研½I‰™¡¹ç›®ä¹‹ä¸€ã€?/div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">½W¬ä¸€ä»£çš„å匘q‡æ×o技术,åˆè¢«¿UîCØ“åŸÞZºŽç”¨æˆ·åQˆUser-basedåQ‰çš„å匘q‡æ×o。基于用æˆïLš„å匘q‡æ×oåQŒåŸºæœ¬åŽŸç†æ˜¯åŸÞZºŽç”¨æˆ·è¡Œäؓ选择的相å…Ïx€§ã€‚用æˆïLš„è¡ŒäØ“é€‰æ‹©˜q™é‡ŒæŒ‡çš„æ˜¯ä¸‹è½½ã€è´­ä¹°ã€è¯„ä»ïL­‰½{‰èƒ½å¤Ÿæ˜¾å¼æˆ–者éšå¼ä½“现出用户喜好的行为。在一个典型的åŸÞZºŽå匘q‡æ×o技术的推è¾pÈ»Ÿä¸­ï¼Œè¾“入数æ®é€šå¸¸å¯ä»¥è¡¨è¿°ä¸ÞZ¸€ä¸ªm×n 的用户内容矩阵RåQŒm是用æˆäh•°åQŒn是内å®ÒŽ•°ã€‚矩é˜ëŠš„å€ég¸Žå†…容的类型有养I¼Œé€šå¸¸ç”Þp¡Œä¸ø™®°å½•模å—决定。如果内å®ÒŽ˜¯¾|‘上书店中的书,则矩é˜ëŠš„值å¯ä»¥è¡¨½Cºç”¨æˆ¯‚´­ä¹îC¸Žå¦ï¼Œä¾‹å¦‚1表示购买åQ?表示没有购买åQ›æˆ–者表½Cºç”¨æˆ·å¯¹å®ƒçš„评ä­h有多高,˜q™æ ·çš„评价值就å¯ä»¥æœ‰å‡ ä¸ªç­‰¾U§ï¼Œæ¯”如常è§çš?ï½?¾U§è¯„价制ã€?/div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">åŸÞZºŽç”¨æˆ·çš„ååŒè¿‡æ»¤ï¼Œé€šè¿‡æ¯”较目标用户的一¾pÕdˆ—è¡ŒäØ“é€‰æ‹©å’Œå…¶ä»–ç”¨æˆ·ä¹‹é—´çš„ç›æ€¼¼æ€§ï¼Œæ¥è¯†åˆ«å‡ºä¸€¾l„相互具有类似喜好的用户åQŒåˆå¯ä»¥¿UîCؓ“åŒå¥½â€ã€‚一旦系¾lŸèƒ½å¤Ÿè¯†åˆ«ä¸€ä¸ªç”¨æˆïLš„åŒå¥½ç”¨æˆ·åQŒå°±èƒ½å¤Ÿž®†ä»–们最感兴­‘£çš„å†…å®¹ä½œäØ“å½“å‰ç”¨æˆ·çš„æŽ¨è结果推èç»™˜q™ä¸ªç”¨æˆ·ã€‚也ž®±æ˜¯è¯ß_¼Œä»¥å‰çš„è¡Œä¸ºé€‰æ‹©ä¸Žä½ ç›æ€¼¼çš„ç”¨æˆøP¼Œåœ¨ä»¥åŽçš„è¡ŒäØ“ä¸­å¾ˆå¯èƒ½ä¹Ÿä¼šå’Œä½ ç›æ€¼¼ã€‚因此将˜q™äº›ç”¨æˆ·åšäؓ基准æ¥å‘你推è内å®V€?/div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">å匘q‡æ×o的核心问题是å¯ÀL‰¾ä¸Žç›®æ ‡ç”¨æˆ·å…´­‘£ç›¸˜q‘的一¾l„用戗÷€‚è¿™¿U相似用户通常被称为最˜q‘邻居(Nearest NeighboråQ‰ã€‚ç”¨æˆ·ä¹‹é—´çš„ç›æ€¼¼åº¦æ˜¯é€šè¿‡æ¯”较两个用户的行为选择矢é‡å¾—到的。目å‰ï¼Œæ¯”è¾ƒè¡ŒäØ“é€‰æ‹©çŸ¢é‡çš„相似度计算æ–ÒŽ³•有许多ç§åQŒæ¯”较ç»å…¸çš„½Ž—法包括泊æ¾ç›¸å…³¾pÀL•°åQˆPerson Correlation CoefficientåQ‰å’Œä½™åëuç›æ€¼¼æ€§ï¼ˆCosine-based SimilarityåQ‰ã€?/div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">“最˜q‘邻居â€äñ”生åŽåQŒæˆ‘们就能够计算得到用户最å¯èƒ½æ„Ÿå…´­‘£çš„内容集(也å«åšTopN推èé›†ï¼‰ã€‚äØ“äº†å¾—åˆ°æŽ¨è集åQŒåˆ†åˆ«ç»Ÿè®¡â€œæœ€˜q‘邻居â€ä¸­çš„用户对ä¸åŒå†…容的兴­‘£åº¦åQŒå–其中排在最å‰é¢çš„内容作为推èé›†ã€‚ä¸‹é¢æ˜¯ä¸€ä¸ªç®€åŒ–çš„½CÞZ¾‹åQšå‡å¦‚用户张三有两个åŒå¥½åQšæŽå››å’ŒçŽ‹äº”ã€?/div> <div style="margin: 0px 0px 0px 21pt; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255); text-indent: 21pt;"> </div> <div style="margin: 0px 0px 0px 21pt; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255); text-indent: 21pt;">张三喜欢看电影AåQ?/div> <div style="margin: 0px 0px 0px 21pt; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255); text-indent: 21pt;">æŽå››å–œæ¬¢çœ‹ç”µå½±AåQŒBåQŒCå’ŒDåQ?/div> <div style="margin: 0px 0px 0px 21pt; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255); text-indent: 21pt;">王五喜欢看电影AåQŒBåQŒDåQŒEå’ŒFåQ?/div> <div style="margin: 0px 0px 0px 21pt; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255); text-indent: 21pt;"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">˜q™æ ·åQŒæŽ¨èç³»¾lŸå°±èƒ½å¤Ÿ˜q‡æ×o出相似用户都喜欢的电影Bå’ŒDä½œäØ“å¼ ä¸‰æœ€å¯èƒ½ä¹Ÿä¼šå–œæ¬¢çš„电影推è给张三ã€?/div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">åŸÞZºŽç”¨æˆ·çš„ååŒè¿‡æ»¤æŠ€æœ¯åœ¨ä¸ªæ€§åŒ–推è¾pÈ»Ÿä¸­èŽ·å¾—äº†æžå¤§çš„æˆåŠŸï¼Œä½†å®ƒæœ‰è‡ªíw«çš„局陿€§ã€‚推è集的äñ”ç”Ÿæ–¹å¼æ„味ç€ä¸€ä¸ªå†…å®¹åªæœ‰å·²¾l被用户选择åQˆè´­ä¹ŽÍ¼‰åŽæ‰æœ‰æœºä¼šè¢«æŽ¨è¾l™å…¶ä»–用戗÷€‚对于一个网上书店æ¥è¯ß_¼Œæ–îC¸Šæž¶çš„书因䏸™¿˜æ²¡æœ‰è¢«ç›¸å½“æ•°é‡çš„用户购买或者评ä»ïLš„记录åQŒä¾¿å¾ˆå°‘有机会被用户的“最˜q‘邻居â€ç­›é€‰è¿›å…¥æŽ¨è集。这个问题,也被¿UîC¹‹ä¸ºååŒè¿‡æ»¤çš„“冷å¯åЍâ€é—®é¢˜ã€?/div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">此外åQŒå› ä¸ø™®¡½Ž—用æˆïLš„ç›æ€¼¼åº¦æ—¶åQŒæ˜¯é€šè¿‡ž®†ç›®æ ‡ç”¨æˆïLš„历å²è¡Œäؓ记录与其他æ¯ä¸€ä¸ªç”¨æˆïLš„记录相比较得出的åQŒæ‰€ä»¥å¯¹äºŽä¸€ä¸ªçŽ°å®žçš„æŽ¨è¾pÈ»Ÿæ¥è¯´åQŒæ‰©å±•性将æˆäØ“éžå¸¸ä¸¥é‡çš„问题。设想一下,对于一个拥有上百万用户的网站æ¥è¯ß_¼Œæ¯è®¡½Ž—一个用户都ž®†æ¶‰åŠåˆ°ä¸Šç™¾ä¸‡æ¬¡çš„æ¯”较,更ä¸è¦è¯´å…¶ä¸­ä¼šå¸¦æ¥çš„大釿•°æ®åº“IOæ“作的开销ã€?/div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">于是½W¬äºŒä»£åŸºäºŽå†…定w¡¹åQˆItem-basedåQ‰çš„å匘q‡æ×o技术就产生了。与åŸÞZºŽç”¨æˆ·çš„æŠ€æœ¯ä¸åŒçš„æ˜¯ï¼Œ˜q™ç§æ–ÒŽ³•比较的是内容™å¹ä¸Žå†…容™å¹ä¹‹é—´çš„ç›æ€¼¼åº¦ã€‚Item-based æ–ÒŽ³•åŒæ ·éœ€è¦è¿›è¡Œä¸‰ä¸ªæ­¥éª¤èŽ·å¾—æŽ¨è:1åQ‰å¾—到内定w¡¹åQˆItemåQ‰çš„历å²è¯„分数æ®åQ?åQ‰é’ˆå¯¹å†…定w¡¹˜q›è¡Œå†…容™å¹ä¹‹é—´çš„ç›æ€¼¼åº¦è®¡½Ž—,扑ֈ°ç›®æ ‡å†…容™å¹çš„“最˜q‘邻居â€ï¼›3åQ‰äñ”生推è。这里内定w¡¹ä¹‹é—´çš„相似度是通过比较两个内容™å¹ä¸Šçš„用戯‚¡Œä¸ºé€‰æ‹©çŸ¢é‡å¾—到的。ä‹D个例å­ï¼Œå‡è®¾ç”¨æˆ·å’Œå†…定w¡¹å¦‚下åQ?/div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);" align="center"> <table style="margin: 0px; padding: 0px; border: medium none; border-collapse: collapse;" border="1" cellpadding="0" cellspacing="0"> <tbody style="margin: 0px; padding: 0px;"> <tr style="margin: 0px; padding: 0px; height: 15pt;"> <td style="margin: 0px; padding: 0cm 5.4pt; border-width: 1.5pt medium 1pt; border-style: solid none; border-top-color: green; width: 40.8pt; border-bottom-color: green; height: 15pt;" valign="top" width="54"> <div style="margin: 0px; padding: 0px;"> </div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border-width: 1.5pt medium 1pt; border-style: solid none; border-top-color: green; width: 51.3pt; border-bottom-color: green; height: 15pt;" valign="top" width="68"> <div style="margin: 0px; padding: 0px;">电媄A</div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border-width: 1.5pt medium 1pt; border-style: solid none; border-top-color: green; width: 50.45pt; border-bottom-color: green; height: 15pt;" valign="top" width="67"> <div style="margin: 0px; padding: 0px;">电媄B</div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border-width: 1.5pt medium 1pt; border-style: solid none; border-top-color: green; width: 51.3pt; border-bottom-color: green; height: 15pt;" valign="top" width="68"> <div style="margin: 0px; padding: 0px;">电媄C</div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border-width: 1.5pt medium 1pt; border-style: solid none; border-top-color: green; width: 51.3pt; border-bottom-color: green; height: 15pt;" valign="top" width="68"> <div style="margin: 0px; padding: 0px;">电媄D</div> </td> </tr> <tr style="margin: 0px; padding: 0px; height: 15.75pt;"> <td style="margin: 0px; padding: 0cm 5.4pt; border: medium none; width: 40.8pt; height: 15.75pt;" valign="top" width="54"> <div style="margin: 0px; padding: 0px;">张三</div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border: medium none; width: 51.3pt; height: 15.75pt;" valign="top" width="68"> <div style="margin: 0px; padding: 0px;">喜欢</div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border: medium none; width: 50.45pt; height: 15.75pt;" valign="top" width="67"> <div style="margin: 0px; padding: 0px;"> </div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border: medium none; width: 51.3pt; height: 15.75pt;" valign="top" width="68"> <div style="margin: 0px; padding: 0px;"> </div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border: medium none; width: 51.3pt; height: 15.75pt;" valign="top" width="68"> <div style="margin: 0px; padding: 0px;"> </div> </td> </tr> <tr style="margin: 0px; padding: 0px; height: 15.75pt;"> <td style="margin: 0px; padding: 0cm 5.4pt; border: medium none; width: 40.8pt; height: 15.75pt;" valign="top" width="54"> <div style="margin: 0px; padding: 0px;">æŽå››</div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border: medium none; width: 51.3pt; height: 15.75pt;" valign="top" width="68"> <div style="margin: 0px; padding: 0px;">喜欢</div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border: medium none; width: 50.45pt; height: 15.75pt;" valign="top" width="67"> <div style="margin: 0px; padding: 0px;">喜欢</div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border: medium none; width: 51.3pt; height: 15.75pt;" valign="top" width="68"> <div style="margin: 0px; padding: 0px;">喜欢</div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border: medium none; width: 51.3pt; height: 15.75pt;" valign="top" width="68"> <div style="margin: 0px; padding: 0px;">喜欢</div> </td> </tr> <tr style="margin: 0px; padding: 0px; height: 15.75pt;"> <td style="margin: 0px; padding: 0cm 5.4pt; border: medium none; width: 40.8pt; height: 15.75pt;" valign="top" width="54"> <div style="margin: 0px; padding: 0px;">王五</div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border: medium none; width: 51.3pt; height: 15.75pt;" valign="top" width="68"> <div style="margin: 0px; padding: 0px;">ä¸å–œ‹Æ?/div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border: medium none; width: 50.45pt; height: 15.75pt;" valign="top" width="67"> <div style="margin: 0px; padding: 0px;"> </div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border: medium none; width: 51.3pt; height: 15.75pt;" valign="top" width="68"> <div style="margin: 0px; padding: 0px;">ä¸å–œ‹Æ?/div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border: medium none; width: 51.3pt; height: 15.75pt;" valign="top" width="68"> <div style="margin: 0px; padding: 0px;">ä¸å–œ‹Æ?/div> </td> </tr> <tr style="margin: 0px; padding: 0px; height: 15.75pt;"> <td style="margin: 0px; padding: 0cm 5.4pt; border-width: medium medium 1.5pt; border-style: none none solid; width: 40.8pt; border-bottom-color: green; height: 15.75pt;" valign="top" width="54"> <div style="margin: 0px; padding: 0px;">赵六</div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border-width: medium medium 1.5pt; border-style: none none solid; width: 51.3pt; border-bottom-color: green; height: 15.75pt;" valign="top" width="68"> <div style="margin: 0px; padding: 0px;">喜欢</div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border-width: medium medium 1.5pt; border-style: none none solid; width: 50.45pt; border-bottom-color: green; height: 15.75pt;" valign="top" width="67"> <div style="margin: 0px; padding: 0px;">喜欢</div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border-width: medium medium 1.5pt; border-style: none none solid; width: 51.3pt; border-bottom-color: green; height: 15.75pt;" valign="top" width="68"> <div style="margin: 0px; padding: 0px;"> </div> </td> <td style="margin: 0px; padding: 0cm 5.4pt; border-width: medium medium 1.5pt; border-style: none none solid; width: 51.3pt; border-bottom-color: green; height: 15.75pt;" valign="top" width="68"> <div style="margin: 0px; padding: 0px;">喜欢</div> </td> </tr> </tbody> </table> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">å¯ä»¥çœ‹å‡ºåQŒç”µå½±A与Dæ˜¯æœ€ç›æ€¼¼çš„。因为张三喜‹Æ¢AåQŒæ‰€ä»¥ç”µå½±Dž®±å¯ä»¥æŽ¨è给张三ã€?/div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">和基于用æˆïLš„æŽ¨è¾pÈ»Ÿç›¸æ¯”åQŒåŸºäºŽå†…定w¡¹çš„æŽ¨èç³»¾lŸæœ€å¤§çš„æ”¹è¿›æ˜¯æ›´å…ähœ‰æ‰©å±•性。基于内定w¡¹çš„æ–¹æ³•通过计算内容™å¹ä¹‹é—´çš„ç›æ€¼¼æ€§æ¥ä»£æ›¿ç”¨æˆ·ä¹‹é—´çš„相似性。对于通常的互è”网应用æ¥è¯´åQŒæä¾›çš„内容™åÒŽ•°é‡ç›¸å¯¹è¾ƒä¸ºç¨³å®šã€‚比如一个大型网上书店,å¯èƒ½å‡ºå”®çš„书¾cæ•°é‡ä¹Ÿž®±åœ¨å‡ å万上下,而用æˆäh•°é‡å°±å¯èƒ½è¾‘Öˆ°å‡ ç™¾ä¸‡ã€‚所以,比è“v用户åQŒå†…定w¡¹ä¹‹é—´çš„相似性计½Ž—需è¦çš„计算é‡è¦ž®‘很多,从而大大é™ä½Žäº†åœ¨çº¿è®¡ç®—é‡ï¼Œæé«˜¾pÈ»Ÿæ€§èƒ½ã€‚基于内定w¡¹çš„æŽ¨èç³»¾lŸåº”用最为æˆåŠŸçš„æ˜¯Amazon。Amazon为此˜q˜ç”³è¯·äº†ä¸€™å¹ä¸“利å«åšâ€Collaborative recommendations using item-to-item similarity mappingsâ€?a title="" name="_ftnref1" style="margin: 0px; padding: 0px; color: rgb(51, 102, 153); text-decoration: none;"><span style="margin: 0px; padding: 0px;"><span style="margin: 0px; padding: 0px;"><span style="margin: 0px; padding: 0px;"><span style="margin: 0px; padding: 0px; font-size: 10.5pt;">[1]</span></span></span></span>。当ç„Óž¼Œåœ¨é™ä½Žäº†è®¡ç®—é‡çš„åŒæ—¶åQŒå®Œå…¨åŸºäºŽå†…定w¡¹çš„æŽ¨è技术也在推è的准确度上åšäº†ž®å°çš„牺牌Ӏ‚大多数情况下,åŸÞZºŽç”¨æˆ·çš„æŽ¨è技术表现è¦ç•¥å¥½äºŽåŸºäºŽå†…定w¡¹çš„æ–¹æ³•。这是因为基于内容的æ–ÒŽ³•忽略了相似用户之间的¾l„群特å¾ã€?/a></div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">ä¸è®ºæ˜¯ç¬¬ä¸€ä»£çš„åŸÞZºŽç”¨æˆ·æ–ÒŽ³•åQŒè¿˜æ˜¯ç¬¬äºŒä»£çš„基于内定w¡¹æ–ÒŽ³•åQŒéƒ½ä¸å¯é¿å…çš„é‡åˆ°æ•°æ®ç¨€ç–的问题。在ä»ÖM½•一个网站中åQŒç”¨æˆïLš„评分记录或者购买记录,相对整个å¯ä¾›é€‰æ‹©çš„内定w›†æ¥è¯´åQŒéƒ½æ˜¯å¾ˆž®çš„一部分。所以在许多推è¾pÈ»Ÿä¸­ï¼Œæ¯ä¸ªç”¨æˆ·æ¶‰åŠçš„æ•°æ®é‡ç›¸å½“有é™åQŒåœ¨ä¸€äº›å¤§çš„ç³»¾lŸå¦‚Amazon中,用户最多丘q‡å°±è¯„ä­h˜q‡ä¸Šç™¾ä¸‡æœ¬ä¹¦çš?åQ…,造æˆè¯„ä¼°æ•°æ®ç›¸å½“½E€ç–。当用户评ä­h˜q‡çš„内容之间找ä¸åˆîCº¤é›†æ—¶åQŒå°±éš¾ä»¥åˆ¤æ–­ç”¨æˆ·çš„å£å‘Ïx˜¯å¦ç›¸ä¼û|¼Œéš¾ä»¥æ‰‘Öˆ°ç›æ€¼¼ç”¨æˆ·é›†ï¼Œå¯ÆD‡´æŽ¨è效果大大é™ä½Žã€‚äØ“äº†è§£å†³ç”¨æˆäh•°æ®çš„½E€ç–问题,最方便的办法就是将用户å¯Ò޲¡æœ‰é€‰æ‹©˜q‡çš„内容™å¹çš„è¯„åˆ†è®¾äØ“ä¸€ä¸ªå›ºå®šçš„¾~ºçœå€û|¼Œä¾‹å¦‚用户的åã^å‡è¯„分。针对如何预‹¹‹é—æ¼çš„è¯„åˆ†ä¸šå†…åˆæå‡ÞZº†å¾ˆå¤š¿U方法,ä¸è¿‡ä¸€èˆ¬æ¥è¯´é‡‡ç”¨æœ€½Ž€å•的改进æ–ÒŽ³•ž®±å¯ä»¥æœ‰æ•ˆåœ°æé«˜å匘q‡æ×o推è¾pÈ»Ÿçš„准¼‹®åº¦ã€?/div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">å¦å¤–一斚w¢åQŒå³ä¾‰K‡‡ç”¨äº†åŸÞZºŽå†…容™å¹çš„æ–ÒŽ³•åQŒåœ¨æ•°æ®é‡å·¨å¤§çš„æ—¶å€™ï¼Œè®¡ç®—夿‚度ä»ç„¶æˆä¸ºæ€§èƒ½ç“‰™¢ˆã€‚äØ“äº†è¿›ä¸€æ­¥è§£å†›_åŒè¿‡æ»¤æŠ€æœ¯çš„æ‰©å±•性能问题åQŒç›®å‰æ¯”较有效的办法是在用户评分数æ®ä¸Šåšä¸€‹Æ¡èš¾cÕdˆ†æž?clustering)。蚾cÀLŠ€æœ¯é¦–å…ˆå°†å…ähœ‰ç›æ€¼¼å…´è¶£çˆ±å¥½çš„用户分é…到相åŒçš„分¾cÖM¸­ã€‚èš¾cÖMñ”生之åŽï¼Œå®ƒæˆ–者将“最˜q‘é‚»å±…â€æœç´¢å¯¹è±¡é™åˆ¶åœ¨æœ€ç›¸è¿‘的蚾cÖM¸­åQŒæ ¹æ®ç±»ä¸­å…¶ä»–用æˆïLš„评ä­hé¢„æµ‹ç›®æ ‡ç”¨æˆ·çš„è¯„ä»øP¼Œæˆ–者用èšç±»çš„ä¸­å¿ƒä½œä¸ø™¿‘ä¼¼æå–推è结果。由于用户之间的分类相对å˜åŒ–比较ž®ï¼Œå› æ­¤èšç±»˜q‡ç¨‹å¾€å¾€å¯ä»¥¼›Èº¿˜q›è¡ŒåQŒè€Œæ— éœ€å®žæ—¶è®¡ç®—åQŒè¿™æ ·å°±å¤§å¤§é™ä½Žäº†å®žæ—¶æŽ¨è的计算压力åQŒæé«˜æŽ¨èç³»¾lŸçš„速度。一般æ¥è¯ß_¼Œèšç±»ž®†ç”¨æˆ·åˆ†ä¸ºå¤šž®‘个¾c»ï¼ŒæŽ¨è¾pÈ»Ÿçš„æ•´ä½“速度ž®Þpƒ½å¤Ÿæé«˜å¤šž®‘å€ã€‚具体选择什么样的蚾cÈ®—法,åˆä¼šå› åº”用领域和数æ®çš„分布特性而ä¸åŒã€‚如果蚾cÈ®—法选择ä¸å½“åQŒå而会é™ä½ŽæŽ¨è的准¼‹®æ€§ã€‚è¿‘òq´æ¥åQŒæŽ¨èç³»¾lŸçš„½Ž—法技术的å‘展也有了一些新的方å‘,比如SlopeOneåQŒSVD½{‰æ–¹æ³•,ž®×ƒ¸ä¸€ä¸€åˆ—ä‹D了ã€?/div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);"> </div> <div style="margin: 0px; padding: 0px; color: rgb(51, 51, 51); font-family: Arial; font-size: 14px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: 26px; orphans: auto; text-align: left; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);">在我看æ¥åQŒä¸€ä¸ªå•†ç”¨æŽ¨èç³»¾lŸçš„ž®¤å…¶å…³é”®ä¹‹å¤„在于å¯ÒŽ“vé‡ç”¨æˆäh•°æ®çš„处ç†ã€‚因为推èç³»¾lŸæ˜¯æ•°æ®ä¼˜å…ˆåQŒæ•°æ®çš„¿U¯ç¯­‘Šå¤šå¯ÒŽŽ¨èçš„¾_‘Öº¦ž®Þp¶Šæœ‰å¥½å¤„。而当用户的行为数æ®çœŸæ­£ç§¯ç´¯åˆ°ä¸Šç™¾ä¸‡ç”šè‡³ä¸Šäº¿æ—¶åQŒå¦‚何在åˆç†æ—‰™—´å†…得出有效的推èåQŒå°±æ˜¯å¯¹æŽ¨è技术最大的考验。除此之外,一个优¿U€çš„æŽ¨èç³»¾lŸéœ€è¦èƒ½å¤Ÿç»“åˆå†…容相ä¼ég¸Žç”¨æˆ·è¡Œäؓ相。传¾lŸçš„å匘q‡æ×oæ–ÒŽ³•是忽略内å®ÒŽœ¬íw«çš„属性的åQŒè¿™ä¸€æ–šw¢å›ºç„¶æ˜¯å¯¹æ•°æ®è¦æ±‚ž®‘的优点åQŒä½†å¦ä¸€æ–šw¢ä¹Ÿå¸¦æ¥äº†éš¾ä»¥é¿å…的“冷å¯åЍâ€é—®é¢˜ã€‚其实,éšç€æ ‡ç­¾¾pÈ»Ÿåœ¨äº’è”网上的òq¿æ³›åº”用åQŒæ ‡½{¾æœ¬íw«å°±ä¸å¤±ä¸ºæ˜¯ä¸€¿U很好的内容属性。如何利用也是值得大家探讨的。充分利用到内容本èín的属性,ž®†ä¸åŒçš„ç›æ€¼¼æ€§ç»“åˆè“væ¥ï¼Œ˜q™ä¼š¾l™åŸºäºŽååŒè¿‡æ»¤çš„æŽ¨èæŠ€æœ¯å¸¦æ¥æ–°çš„动力。最åŽä¸€ç‚¹ï¼Œè®¾è®¡è‰¯å¥½çš„æŽ¨è技术è¦èƒ½å¤Ÿä»Žç”¨æˆ·å¯¹æŽ¨è内容的å馈中自行调整和学习。因为实际上æ¯ä¸ªç”¨æˆ·å¯¹äºŽæŽ¨è的内定wƒ½æœ‰ä¸åŒçš„è¦æ±‚åQŒæ¯”如有的用户å¯èƒ½å好比较热门的内容åQŒæœ‰çš„用æˆäh›´æ„¿æ„å‘现冷门的内å®V€‚针对ä¸åŒç”¨æˆïLš„å馈æ¥ä¸æ–­å­¦ä¹ æ¯ä¸ªç”¨æˆïLš„特å¾åQŒæ‰èƒ½å¤Ÿé¿å…所采用½Ž—法本èín先天的åå·®ï¼ŒèŽ·å¾—è¾ƒäØ“ç†æƒ³çš„æ•ˆæžœã€?/div> <img src ="http://www.aygfsteel.com/libin2722/aggbug/396041.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.aygfsteel.com/libin2722/" target="_blank">½C¼ç‰©</a> 2013-03-04 16:39 <a href="http://www.aygfsteel.com/libin2722/articles/396041.html#Feedback" target="_blank" style="text-decoration:none;">å‘表评论</a></div>]]></description></item><item><title>探烦推è引擎内部的秘密,½W?1 部分: 推èå¼•æ“ŽåˆæŽ¢http://www.aygfsteel.com/libin2722/articles/396035.html½C¼ç‰©½C¼ç‰©Mon, 04 Mar 2013 06:30:00 GMThttp://www.aygfsteel.com/libin2722/articles/396035.htmlhttp://www.aygfsteel.com/libin2722/comments/396035.htmlhttp://www.aygfsteel.com/libin2722/articles/396035.html#Feedback0http://www.aygfsteel.com/libin2722/comments/commentRss/396035.htmlhttp://www.aygfsteel.com/libin2722/services/trackbacks/396035.html

½Ž€ä»‹ï¼šÂ éšç€ Web 技术的å‘展åQŒä‹É得内容的创å¾å’Œåˆ†äº«å˜å¾—è¶Šæ¥è¶Šå®ÒŽ˜“。æ¯å¤©éƒ½æœ‰å¤§é‡çš„囄¡‰‡ã€åšå®¢ã€è§†é¢‘å‘布到¾|‘上。信æ¯çš„æžåº¦çˆ†ç‚¸ä½¿å¾—äºÞZ»¬æ‰‘Öˆ°ä»–们需è¦çš„信毞®†å˜å¾—è¶Šæ¥è¶Šéš¾ã€‚ä¼ ¾lŸçš„æœçƒ¦æŠ€æœ¯æ˜¯ä¸€ä¸ªç›¸å¯¹ç®€å•的帮助äºÞZ»¬æ‰‘Öˆ°ä¿¡æ¯çš„工典P¼Œä¹Ÿå¹¿æ³›çš„被äh们所使用åQŒä½†æœçƒ¦å¼•擎òq¶ä¸èƒ½å®Œå…¨æ»¡­‘³ç”¨æˆ·å¯¹ä¿¡æ¯å‘现的需求,原因一是用户很隄¡”¨æ°å½“çš„å…³é”®è¯æè¿°è‡ªå·±çš„éœ€æ±‚ï¼ŒäºŒæ˜¯åŸÞZºŽå…³é”®è¯çš„信毋‚€ç´¢åœ¨å¾ˆå¤šæƒ…况下是ä¸å¤Ÿçš„。而推è引擎的出现åQŒä‹É用户获å–ä¿¡æ¯çš„æ–¹å¼ä»Ž½Ž€å•的目标明确的数æ®çš„æœçƒ¦è½¬æ¢åˆ°æ›´é«˜çñ”更符åˆäh们ä‹Éç”¨ä¹ æƒ¯çš„ä¸Šä¸‹æ–‡ä¿¡æ¯æ›´ä¸°å¯Œçš„ä¿¡æ¯å‘现ã€?/p>

å‘布日期åQ?/b> 2011 òq?3 æœ?16 æ—?span class="Apple-converted-space"> 
¾U§åˆ«åQ?/b> 高çñ” 
讉K—®æƒ…况 åQ?/strong> 65031 ‹Æ¡æµè§?span class="Apple-converted-space"> 
评论åQ?/strong> 11 (查看 | æ·ÕdŠ è¯„è®ºÂ - ç™Õd½•)

òq›_‡åˆ?5 æ˜?å…?236 个评åˆ? src=  òq›_‡åˆ?(236个评åˆ?
为本文评�/a>

“探索推è引擎内部的¿U˜å¯†â€ç³»åˆ—将带领读者从‹¹…å…¥æ·Þqš„学习探烦推è引擎的机åˆÓž¼Œå®žçްæ–ÒŽ³•åQŒå…¶ä¸­è¿˜æ¶‰åŠä¸€äº›åŸºæœ¬çš„优化æ–ÒŽ³•åQŒä¾‹å¦‚èš¾cÕd’Œåˆ†ç±»çš„åº”ç”¨ã€‚åŒæ—¶åœ¨ç†è®ºè®²è§£çš„基¼‹€ä¸Šï¼Œ˜q˜ä¼š¾l“åˆ Apache Mahout 介ç»å¦‚何在大规模数æ®ä¸Šå®žçŽ°å„¿U推è策略,˜q›è¡Œ½{–略优化åQŒæž„建高效的推èå¼•æ“Žçš„æ–¹æ³•ã€‚æœ¬æ–‡ä½œä¸ø™¿™ä¸ªç³»åˆ—çš„½W¬ä¸€½‹‡æ–‡ç« ï¼Œž®†æ·±å…¥ä»‹¾l推è引擎的工作原ç†åQŒå’Œå…¶ä¸­æ¶‰åŠçš„å„¿UæŽ¨èæœºåˆÓž¼Œä»¥åŠå®ƒä»¬å„自的优¾~ºç‚¹å’Œé€‚用场景åQŒå¸®åŠ©ç”¨æˆäh¸…楚的了解和快速构建适åˆè‡ªå·±çš„æŽ¨è引擎ã€?/p>

ä¿¡æ¯å‘现

如今已绘q›å…¥äº†ä¸€ä¸ªæ•°æ®çˆ†ç‚¸çš„æ—¶ä»£åQŒéšç€ Web 2.0 çš„å‘展, Web å·²ç»å˜æˆæ•°æ®åˆ†äínçš„åã^åŽÍ¼Œé‚£ä¹ˆåQŒå¦‚何让äºÞZ»¬åœ¨æ“vé‡çš„æ•°æ®ä¸­æƒ³è¦æ‰¾åˆîC»–们需è¦çš„信毞®†å˜å¾—è¶Šæ¥è¶Šéš¾ã€?/p>

在这æ ïLš„æƒ…åŞ下,æœçƒ¦å¼•擎åQˆGoogleåQŒBingåQŒç™¾åº¦ç­‰½{‰ï¼‰æˆäؓ大家快速找到目标信æ¯çš„æœ€å¥½é€”径。在用户对自己需求相å¯ÒŽ˜Ž¼‹®çš„æ—¶å€™ï¼Œç”¨æœç´¢å¼•擎很方便的通过关键字æœç´¢å¾ˆå¿«çš„æ‰‘Öˆ°è‡ªå·±éœ€è¦çš„ä¿¡æ¯ã€‚但æœçƒ¦å¼•擎òq¶ä¸èƒ½å®Œå…¨æ»¡­‘³ç”¨æˆ·å¯¹ä¿¡æ¯å‘çŽ°çš„éœ€æ±‚ï¼Œé‚£æ˜¯å› äØ“åœ¨å¾ˆå¤šæƒ…å†µä¸‹åQŒç”¨æˆ·å…¶å®žåÆˆä¸æ˜Ž¼‹®è‡ªå·Þqš„需è¦ï¼Œæˆ–者他们的需求很隄¡”¨½Ž€å•的关键字æ¥è¡¨è¿°ã€‚åˆæˆ–è€…ä»–ä»¬éœ€è¦æ›´åŠ ç¬¦åˆä»–们个人å£å‘›_’Œå–œå¥½çš„结果,因此出现了推èç³»¾lŸï¼Œä¸Žæœç´¢å¼•æ“Žå¯¹åº”ï¼Œå¤§å®¶ä¹Ÿä¹ æƒ¯ç§°å®ƒäØ“æŽ¨è引擎ã€?/p>

éšç€æŽ¨è引擎的出玎ͼŒç”¨æˆ·èŽ·å–ä¿¡æ¯çš„æ–¹å¼ä»Ž½Ž€å•的目标明确的数æ®çš„æœçƒ¦è½¬æ¢åˆ°æ›´é«˜çñ”更符åˆäh们ä‹É用习惯的信æ¯å‘现ã€?/p>

如今åQŒéšç€æŽ¨èæŠ€æœ¯çš„ä¸æ–­å‘展åQŒæŽ¨è引擎已¾l在电å­å•†åŠ¡ (E-commerceåQŒä¾‹å¦?AmazonåQŒå½“当网 ) 和一些基äº?social 的社会化站点 ( 包括音ä¹åQŒç”µå½±å’Œå›¾ä¹¦åˆ†äínåQŒä¾‹å¦‚豆瓣,Mtime ½{?) 都å–得很大的æˆåŠŸã€‚è¿™ä¹Ÿè¿›ä¸€æ­¥çš„è¯´æ˜Žäº†ï¼ŒWeb2.0 环境下,在é¢å¯ÒŽ“vé‡çš„æ•°æ®åQŒç”¨æˆ·éœ€è¦è¿™¿U更加智能的åQŒæ›´åŠ äº†è§£ä»–ä»¬éœ€æ±‚ï¼Œå£å‘³å’Œå–œå¥½çš„ä¿¡æ¯å‘现机制ã€?/p>

推è引擎

å‰é¢ä»‹ç»äº†æŽ¨è引擎对于现在的 Web2.0 站点的é‡è¦æ„义,˜q™ä¸€ç« æˆ‘们将讲讲推è引擎到底是怎么工作的。推è引擎利用特ŒDŠçš„信毘q‡æ×o技术,ž®†ä¸åŒçš„ç‰©å“æˆ–内å®ÒŽŽ¨èç»™å¯èƒ½å¯¹å®ƒä»¬æ„Ÿå…´è¶£çš„用戗÷€?/p>
å›?1. 推è引擎工作原ç†å›?/b>
å›?1. 推è引擎工作原ç†å›? src=  

å›?1 ¾l™å‡ºäº†æŽ¨è引擎的工作原ç†å›¾ï¼Œ˜q™é‡Œå…ˆå°†æŽ¨è引擎看作黑盒åQŒå®ƒæŽ¥å—的输入是推èçš„æ•°æ®æºåQŒä¸€èˆ¬æƒ…况下åQŒæŽ¨è引擎所需è¦çš„æ•°æ®æºåŒ…括:

  • è¦æŽ¨èç‰©å“æˆ–内容的元数æ®åQŒä¾‹å¦‚关键字åQŒåŸºå› æ˜q°ç­‰åQ?/li>
  • ¾pÈ»Ÿç”¨æˆ·çš„基本信æ¯ï¼Œä¾‹å¦‚性别åQŒå¹´é¾„ç­‰
  • ç”¨æˆ·å¯¹ç‰©å“æˆ–者信æ¯çš„å好åQŒæ ¹æ®åº”用本íw«çš„ä¸åŒåQŒå¯èƒ½åŒ…括用户对物å“的评分,用户查看物å“的记录,用户的购买记录等。其实这些用æˆïLš„å好信æ¯å¯ä»¥åˆ†äؓ两类åQ?/li>
  • 昑ּ的用户å馈:˜q™ç±»æ˜¯ç”¨æˆ·åœ¨¾|‘站上自然æµè§ˆæˆ–者ä‹É用网站以外,昑ּ的æä¾›å馈信æ¯ï¼Œä¾‹å¦‚用户对物å“的评分åQŒæˆ–者对物å“的评论ã€?/li>
  • éšå¼çš„用户å馈:˜q™ç±»æ˜¯ç”¨æˆ·åœ¨ä½¿ç”¨¾|‘站是äñ”生的数æ®åQŒéšå¼çš„å应了用户对物å“的喜好,例如用户购买了æŸç‰©å“åQŒç”¨æˆähŸ¥çœ‹äº†æŸç‰©å“的信毽{‰ç­‰ã€?/li>

昑ּ的用户å馈能准确的å应用户对物å“的真实喜好,但需è¦ç”¨æˆ·ä»˜å‡ºé¢å¤–的代ä­håQŒè€Œéšå¼çš„ç”¨æˆ·è¡ŒäØ“åQŒé€šè¿‡ä¸€äº›åˆ†æžå’Œå¤„ç†åQŒä¹Ÿèƒ½å映用æˆïLš„喜好åQŒåªæ˜¯æ•°æ®ä¸æ˜¯å¾ˆ¾_„¡¡®åQŒæœ‰äº›è¡Œä¸ºçš„分æžå­˜åœ¨è¾ƒå¤§çš„噪韟뀂但åªè¦é€‰æ‹©æ­£ç¡®çš„行为特å¾ï¼Œéšå¼çš„用户å馈也能得到很好的效果åQŒåªæ˜¯è¡Œä¸ºç‰¹å¾çš„选择å¯èƒ½åœ¨ä¸åŒçš„应用中有很大的ä¸åŒï¼Œä¾‹å¦‚在电å­å•†åŠ¡çš„¾|‘ç«™ä¸Šï¼Œè´­ä¹°è¡ŒäØ“å…¶å®žž®±æ˜¯ä¸€ä¸ªèƒ½å¾ˆå¥½è¡¨çŽ°ç”¨æˆ·å–œå¥½çš„éšå¼å馈ã€?/p>

推è引擎æ ÒŽ®ä¸åŒçš„æŽ¨è机制å¯èƒ½ç”¨åˆ°æ•°æ®æºä¸­çš„一部分åQŒç„¶åŽæ ¹æ®è¿™äº›æ•°æ®ï¼Œåˆ†æžå‡ÞZ¸€å®šçš„规则或者直接对用户对其他物å“的喜好˜q›è¡Œé¢„测计算。这æ ähލè引擎å¯ä»¥åœ¨ç”¨æˆ·˜q›å…¥çš„æ—¶å€™ç»™ä»–推èä»–å¯èƒ½æ„Ÿå…´­‘£çš„物å“ã€?/p>

推è引擎的分¾c?/span>

推è引擎的分¾cÕd¯ä»¥æ ¹æ®å¾ˆå¤šæŒ‡æ ‡ï¼Œä¸‹é¢æˆ‘们一一介ç»ä¸€ä¸‹ï¼š

  1. 推èå¼•æ“Žæ˜¯ä¸æ˜¯äØ“ä¸åŒçš„用æˆähލèä¸åŒçš„æ•°æ®

    æ ÒŽ®˜q™ä¸ªæŒ‡æ ‡åQŒæŽ¨è引擎å¯ä»¥åˆ†ä¸ºåŸºäºŽå¤§ä¼—行为的推è引擎和个性化推è引擎

    • æ ÒŽ®å¤§ä¼—è¡ŒäØ“çš„æŽ¨è引擎,å¯ÒŽ¯ä¸ªç”¨æˆ·éƒ½¾l™å‡ºåŒæ ·çš„æŽ¨è,˜q™äº›æŽ¨èå¯ä»¥æ˜¯é™æ€çš„ç”Þq³»¾lŸç®¡ç†å‘˜äººå·¥è®‘Ö®šçš„,或者基于系¾lŸæ‰€æœ‰ç”¨æˆïLš„å馈¾lŸè®¡è®¡ç®—出的当下比较‹¹è¡Œçš„物å“ã€?/li>
    • 个性化推è引擎åQŒå¯¹ä¸åŒçš„ç”¨æˆøP¼Œæ ÒŽ®ä»–ä»¬çš„å£å‘›_’Œå–œå¥½¾l™å‡ºæ›´åŠ ¾_„¡¡®çš„æŽ¨è,˜q™æ—¶åQŒç³»¾lŸéœ€è¦äº†è§£éœ€æŽ¨è内容和用æˆïLš„特质åQŒæˆ–者基于社会化¾|‘络åQŒé€šè¿‡æ‰‘Öˆ°ä¸Žå½“å‰ç”¨æˆïL›¸åŒå–œå¥½çš„用户åQŒå®žçŽ°æŽ¨èã€?/li>

    ˜q™æ˜¯ä¸€ä¸ªæœ€åŸºæœ¬çš„æŽ¨è引擎分¾c»ï¼Œå…¶å®žå¤§éƒ¨åˆ†äh们讨论的推è引擎都是ž®†ä¸ªæ€§åŒ–的推èå¼•æ“Žï¼Œå› äØ“ä»Žæ ¹æœ¬ä¸Šè¯ß_¼Œåªæœ‰ä¸ªæ€§åŒ–的推èå¼•æ“Žæ‰æ˜¯æ›´åŠ æ™ºèƒ½çš„ä¿¡æ¯å‘现˜q‡ç¨‹ã€?/p>

  2. æ ÒŽ®æŽ¨èå¼•æ“Žçš„æ•°æ®æº

    其实˜q™é‡Œè®²çš„æ˜¯å¦‚何å‘现数æ®çš„ç›¸å…³æ€§ï¼Œå› äØ“å¤§éƒ¨åˆ†æŽ¨è引擎的工作原熘q˜æ˜¯åŸÞZºŽç‰©å“或者用æˆïLš„ç›æ€¼¼é›†è¿›è¡ŒæŽ¨è。那么å‚考图 1 ¾l™å‡ºçš„æŽ¨èç³»¾lŸåŽŸç†å›¾åQŒæ ¹æ®ä¸åŒçš„æ•°æ®æºå‘现数æ®ç›¸å…Ïx€§çš„æ–ÒŽ³•å¯ä»¥åˆ†äؓ以下几ç§åQ?/p>

    • æ ÒŽ®¾pÈ»Ÿç”¨æˆ·çš„基本信æ¯å‘现用æˆïLš„相关½E‹åº¦åQŒè¿™¿U被¿UîCØ“åŸÞZºŽäººå£¾lŸè®¡å­¦çš„æŽ¨èåQˆDemographic-based RecommendationåQ?/li>
    • æ ÒŽ®æŽ¨èç‰©å“æˆ–内容的元数æ®ï¼Œå‘çŽ°ç‰©å“æˆ–者内容的相关性,˜q™ç§è¢«ç§°ä¸ºåŸºäºŽå†…容的推èåQˆContent-based RecommendationåQ?/li>
    • æ ÒŽ®ç”¨æˆ·å¯¹ç‰©å“æˆ–者信æ¯çš„å好åQŒå‘çŽ°ç‰©å“æˆ–者内å®ÒŽœ¬íw«çš„相关性,或者是å‘现用户的相å…Ïx€§ï¼Œ˜q™ç§è¢«ç§°ä¸ºåŸºäºŽååŒè¿‡æ»¤çš„æŽ¨èåQˆCollaborative Filtering-based RecommendationåQ‰ã€?/li>
  3. æ ÒŽ®æŽ¨èæ¨¡åž‹çš„å¾ç«‹æ–¹å¼?p style="font-family: arial, nsimsun, sans-serif; margin: 0px; padding: 0.3em 5px 0px 0px; font-size: 1em;">å¯ä»¥æƒŒ™±¡åœ¨æ“vé‡ç‰©å“和用户的系¾lŸä¸­åQŒæŽ¨èå¼•æ“Žçš„è®¡ç®—é‡æ˜¯ç›¸å½“大的åQŒè¦å®žçŽ°å®žæ—¶çš„æŽ¨è务必需è¦å¾ç«‹ä¸€ä¸ªæŽ¨èæ¨¡åž‹ï¼Œå…³äºŽæŽ¨èæ¨¡åž‹çš„å¾ç«‹æ–¹å¼å¯ä»¥åˆ†ä¸ÞZ»¥ä¸‹å‡ ¿U:

    • åŸÞZºŽç‰©å“和用æˆähœ¬íw«çš„åQŒè¿™¿U推è引擎将æ¯ä¸ªç”¨æˆ·å’Œæ¯ä¸ªç‰©å“都当作独立的实体,预测æ¯ä¸ªç”¨æˆ·å¯¹äºŽæ¯ä¸ªç‰©å“的喜好程度,˜q™äº›ä¿¡æ¯å¾€å¾€æ˜¯ç”¨ä¸€ä¸ªäºŒ¾l´çŸ©é˜‰|˜q°çš„。由于用æˆäh„Ÿå…´è¶£çš„物å“远˜qœå°äºŽæ€È‰©å“的数目åQŒè¿™æ ïLš„æ¨¡åž‹å¯ÆD‡´å¤§é‡çš„æ•°æ®ç©º¾|®ï¼ŒåÏxˆ‘们得到的二维矩阵往往是一个很大的½E€ç–矩é˜üc€‚åŒæ—¶äؓ了凞®è®¡½Ž—é‡åQŒæˆ‘们å¯ä»¥å¯¹ç‰©å“和用戯‚¿›è¡Œèš¾c»ï¼Œ ç„¶åŽè®°å½•和计½Ž—一¾cÈ”¨æˆ·å¯¹ä¸€¾cȉ©å“的喜好½E‹åº¦åQŒä½†˜q™æ ·çš„æ¨¡åž‹åˆä¼šåœ¨æŽ¨è的准¼‹®æ€§ä¸Šæœ‰æŸå¤±ã€?/li>
    • åŸÞZºŽå…Œ™”规则的推è(Rule-based RecommendationåQ‰ï¼šå…Œ™”规则的挖掘已¾læ˜¯æ•°æ®æŒ–掘中的一个ç»å…¸çš„问题åQŒä¸»è¦æ˜¯æŒ–掘一些数æ®çš„ä¾èµ–关系åQŒå…¸åž‹çš„场景ž®±æ˜¯â€œè´­ç‰©ç¯®é—®é¢˜â€ï¼Œé€šè¿‡å…Œ™”规则的挖掘,我们å¯ä»¥æ‰‘Öˆ°å“ªäº›ç‰©å“¾lå¸¸è¢«åŒæ—¶è´­ä¹ŽÍ¼Œæˆ–者用戯‚´­ä¹îCº†ä¸€äº›ç‰©å“åŽé€šå¸¸ä¼šè´­ä¹°å“ªäº›å…¶ä»–的物å“åQŒå½“æˆ‘ä»¬æŒ–æŽ˜å‡ø™¿™äº›å…³è”规则之åŽï¼Œæˆ‘们å¯ä»¥åŸÞZºŽ˜q™äº›è§„则¾l™ç”¨æˆ¯‚¿›è¡ŒæŽ¨èã€?/li>
    • åŸÞZºŽæ¨¡åž‹çš„æŽ¨è(Model-based RecommendationåQ‰ï¼š˜q™æ˜¯ä¸€ä¸ªå…¸åž‹çš„æœºå™¨å­¦ä¹ çš„问题,å¯ä»¥ž®†å·²æœ‰çš„用户喜好信æ¯ä½œäؓ训练æ ähœ¬åQŒè®­¾lƒå‡ºä¸€ä¸ªé¢„‹¹‹ç”¨æˆ·å–œå¥½çš„æ¨¡åž‹åQŒè¿™æ ·ä»¥åŽç”¨æˆ·åœ¨˜q›å…¥¾pÈ»ŸåQŒå¯ä»¥åŸºäºŽæ­¤æ¨¡åž‹è®¡ç®—推è。这¿U方法的问题在于如何ž®†ç”¨æˆ·å®žæ—¶æˆ–者近期的喜好信æ¯å馈¾l™è®­¾lƒå¥½çš„æ¨¡åž‹ï¼Œä»Žè€Œæé«˜æŽ¨è的准确度ã€?/li>

其实在现在的推è¾pÈ»Ÿä¸­ï¼Œå¾ˆå°‘有åªä½¿ç”¨äº†ä¸€ä¸ªæŽ¨è策略的推è引擎åQŒä¸€èˆ¬éƒ½æ˜¯åœ¨ä¸åŒçš„场景下使用ä¸åŒçš„æŽ¨èç­–ç•¥ä»Žè€Œè¾¾åˆ°æœ€å¥½çš„æŽ¨èæ•ˆæžœåQŒä¾‹å¦?Amazon 的推è,它将åŸÞZºŽç”¨æˆ·æœ¬èín历å²è´­ä¹°æ•°æ®çš„æŽ¨èï¼Œå’ŒåŸºäºŽç”¨æˆ·å½“å‰æµè§ˆçš„物å“的推è,以åŠåŸÞZºŽå¤§ä¼—喜好的当下比较æµè¡Œçš„物å“都在ä¸åŒçš„区域推è给用户åQŒè®©ç”¨æˆ·å¯ä»¥ä»Žå…¨æ–¹ä½çš„æŽ¨è中扑ֈ°è‡ªå·±çœŸæ­£æ„Ÿå…´­‘£çš„物å“ã€?/p>

æ·±å…¥æŽ¨èæœºåˆ¶

˜q™ä¸€ç« çš„½‹‡å¹…åQŒå°†è¯¦ç»†ä»‹ç»å„ä¸ªæŽ¨èæœºåˆ¶çš„工作原ç†ï¼Œå®ƒä»¬çš„优¾~ºç‚¹ä»¥åŠåº”用场景ã€?/p>

åŸÞZºŽäººå£¾lŸè®¡å­¦çš„æŽ¨è

åŸÞZºŽäººå£¾lŸè®¡å­¦çš„æŽ¨è机制åQˆDemographic-based RecommendationåQ‰æ˜¯ä¸€¿Uæœ€æ˜“äºŽå®žçŽ°çš„æŽ¨èæ–¹æ³•ï¼Œå®ƒåªæ˜¯ç®€å•çš„æ ÒŽ®¾pÈ»Ÿç”¨æˆ·çš„基本信æ¯å‘现用æˆïLš„相关½E‹åº¦åQŒç„¶åŽå°†ç›æ€¼¼ç”¨æˆ·å–œçˆ±çš„å…¶ä»–ç‰©å“æŽ¨è给当å‰ç”¨æˆ·åQŒå›¾ 2 ¾l™å‡ºäº†è¿™¿U推è的工作原ç†ã€?/p>
å›?2. åŸÞZºŽäººå£¾lŸè®¡å­¦çš„æŽ¨è机制的工作原ç?/b>
å›?2. åŸÞZºŽäººå£¾lŸè®¡å­¦çš„æŽ¨è机制的工作原ç? src=  

从图中å¯ä»¥å¾ˆæ¸…楚的看刎ͼŒé¦–å…ˆåQŒç³»¾lŸå¯¹æ¯ä¸ªç”¨æˆ·éƒ½æœ‰ä¸€ä¸ªç”¨æˆ?Profile çš„å¾æ¨¡ï¼Œå…¶ä¸­åŒ…括用户的基本信æ¯ï¼Œä¾‹å¦‚用户的年龄,性别½{‰ç­‰åQ›ç„¶åŽï¼Œ¾pÈ»Ÿä¼šæ ¹æ®ç”¨æˆïLš„ Profile 计算用户的相似度åQŒå¯ä»¥çœ‹åˆ°ç”¨æˆ?A çš?Profile 和用æˆ?C ä¸€æ øP¼Œé‚£ä¹ˆ¾pÈ»Ÿä¼šè®¤ä¸ºç”¨æˆ?A å’?C æ˜¯ç›¸ä¼¼ç”¨æˆøP¼Œåœ¨æŽ¨è引擎中åQŒå¯ä»¥ç§°ä»–们是“邻居â€ï¼›æœ€åŽï¼ŒåŸÞZºŽâ€œé‚»å±…â€ç”¨æˆïL¾¤çš„喜好推è给当å‰ç”¨æˆ·ä¸€äº›ç‰©å“,图中ž®†ç”¨æˆ?A 喜欢的物å“?A 推è¾l™ç”¨æˆ?Cã€?/p>

˜q™ç§åŸÞZºŽäººå£¾lŸè®¡å­¦çš„æŽ¨è机制的好处在于:

  1. 因䨓ä¸ä‹É用当å‰ç”¨æˆ·å¯¹ç‰©å“çš„å–œå¥½åŽ†å²æ•°æ®ï¼Œæ‰€ä»¥å¯¹äºŽæ–°ç”¨æˆ·æ¥è®²æ²¡æœ‰â€œå†·å¯åЍåQˆCold StartåQ‰â€çš„问题ã€?/li>
  2. ˜q™ä¸ªæ–ÒŽ³•ä¸ä¾èµ–äºŽç‰©å“æœ¬èín的数æ®ï¼Œæ‰€ä»¥è¿™ä¸ªæ–¹æ³•在ä¸åŒç‰©å“的领域都å¯ä»¥ä½¿ç”¨åQŒå®ƒæ˜¯é¢†åŸŸç‹¬ç«‹çš„åQˆdomain-independentåQ‰ã€?/li>

那么˜q™ä¸ªæ–ÒŽ³•的缺点和问题是什么呢åQŸè¿™¿U基于用æˆïLš„基本信æ¯å¯¹ç”¨æˆ¯‚¿›è¡Œåˆ†¾cÈš„æ–ÒŽ³•˜q‡äºŽ¾_—ç³™åQŒå°¤å…¶æ˜¯å¯¹å“呌™¦æ±‚较高的领域åQŒæ¯”如图书,电媄和音ä¹ç­‰é¢†åŸŸåQŒæ— æ³•å¾—åˆ°å¾ˆå¥½çš„æŽ¨èæ•ˆæžœã€‚å¯èƒ½åœ¨ä¸€äº›ç”µå­å•†åŠ¡çš„¾|‘站中,˜q™ä¸ªæ–ÒŽ³•å¯ä»¥¾l™å‡ºä¸€äº›ç®€å•的推è。å¦å¤–ä¸€ä¸ªå±€é™æ˜¯åQŒè¿™ä¸ªæ–¹æ³•å¯èƒ½æ¶‰åŠåˆ°ä¸€äº›ä¸Žä¿¡æ¯å‘现问题本èínæ— å…³å´æ¯”è¾ƒæ•æ„Ÿçš„ä¿¡æ¯åQŒæ¯”如用æˆïLš„òq´é¾„½{‰ï¼Œ˜q™äº›ç”¨æˆ·ä¿¡æ¯ä¸æ˜¯å¾ˆå¥½èŽ·å–ã€?/p>

åŸÞZºŽå†…容的推è?/span>

åŸÞZºŽå†…å®¹çš„æŽ¨èæ˜¯åœ¨æŽ¨è引擎出çŽîC¹‹åˆåº”ç”¨æœ€ä¸ºå¹¿æ³›çš„æŽ¨èæœºåˆ¶åQŒå®ƒçš„æ ¸å¿ƒæ€æƒ³æ˜¯æ ¹æ®æŽ¨èç‰©å“æˆ–内容的元数æ®åQŒå‘çŽ°ç‰©å“æˆ–者内容的相关性,然åŽåŸÞZºŽç”¨æˆ·ä»¥å¾€çš„喜好记录,推è¾l™ç”¨æˆïL›¸ä¼¼çš„物å“。图 3 ¾l™å‡ºäº†åŸºäºŽå†…å®ÒŽŽ¨è的基本原ç†ã€?/p>
å›?3. åŸÞZºŽå†…å®¹æŽ¨èæœºåˆ¶çš„基本原ç?/b>
å›?3. åŸÞZºŽå†…å®¹æŽ¨èæœºåˆ¶çš„基本原ç? src=  

å›?3 中给å‡ÞZº†åŸÞZºŽå†…容推è的一个典型的例å­åQŒç”µå½±æŽ¨èç³»¾lŸï¼Œé¦–先我们需è¦å¯¹ç”µåª„çš„å…ƒæ•°æ®æœ‰ä¸€ä¸ªå¾æ¨¡ï¼Œ˜q™é‡Œåªç®€å•çš„æè¿°äº†ä¸€ä¸‹ç”µå½Þqš„¾cÕdž‹åQ›ç„¶åŽé€šè¿‡ç”µåª„的元数æ®å‘çŽ°ç”µåª„é—´çš„ç›æ€¼¼åº¦ï¼Œå› äØ“¾cÕdž‹éƒ½æ˜¯â€œçˆ±æƒ…,‹¹ªæ˜Oâ€ç”µå½?A å’?C è¢«è®¤ä¸ºæ˜¯ç›æ€¼¼çš„电影(当然åQŒåªæ ÒŽ®¾cÕdž‹æ˜¯ä¸å¤Ÿçš„åQŒè¦å¾—到更好的推è,我们˜q˜å¯ä»¥è€ƒè™‘电媄的导演,演员½{‰ç­‰åQ‰ï¼›æœ€åŽå®žçŽ°æŽ¨è,对于用户 AåQŒä»–喜欢看电å½?AåQŒé‚£ä¹ˆç³»¾lŸå°±å¯ä»¥¾l™ä»–推è¾cÖM¼¼çš„电å½?Cã€?/p>

˜q™ç§åŸÞZºŽå†…å®¹çš„æŽ¨èæœºåˆ¶çš„å¥½å¤„åœ¨äºŽå®ƒèƒ½å¾ˆå¥½çš„å¾æ¨¡ç”¨æˆïLš„å£å‘³åQŒèƒ½æä¾›æ›´åŠ ¾_„¡¡®çš„æŽ¨è。但它也存在以下几个问题åQ?/p>

  1. 需è¦å¯¹ç‰©å“˜q›è¡Œåˆ†æžå’Œå¾æ¨¡ï¼ŒæŽ¨è的质é‡ä¾èµ–äºŽå¯¹ç‰©å“æ¨¡åž‹çš„完整和全é¢ç¨‹åº¦ã€‚在现在的应用中我们å¯ä»¥è§‚察到关键è¯å’Œæ ‡½{¾ï¼ˆTagåQ‰è¢«è®¤äؓ是æ˜q°ç‰©å“元数æ®çš„一¿Uç®€å•æœ‰æ•ˆçš„æ–ÒŽ³•ã€?/li>
  2. 物å“ç›æ€¼¼åº¦çš„分æžä»…ä»…ä¾èµ–äºŽç‰©å“æœ¬íw«çš„特å¾åQŒè¿™é‡Œæ²¡æœ‰è€ƒè™‘人对物å“çš„æ€åº¦ã€?/li>
  3. å› äØ“éœ€è¦åŸºäºŽç”¨æˆ·ä»¥å¾€çš„喜好历å²åšå‡ºæŽ¨è,所以对于新用户有“冷å¯åЍâ€çš„问题ã€?/li>

虽然˜q™ä¸ªæ–ÒŽ³•有很多中‘›_’Œé—®é¢˜åQŒä½†ä»–还是æˆåŠŸçš„åº”ç”¨åœ¨ä¸€äº›ç”µå½±ï¼ŒéŸ³ä¹åQŒå›¾ä¹¦çš„½C¾äº¤ç«™ç‚¹åQŒæœ‰äº›ç«™ç‚¹è¿˜è¯·ä¸“业的人员对物å“进行基因编ç ï¼Œæ¯”如潘多拉,在一份报告中说é“åQŒåœ¨æ½˜å¤šæ‹‰çš„æŽ¨è引擎中,æ¯é¦–歌有­‘…过 100 个元数æ®ç‰¹å¾åQŒåŒ…括歌曲的风格åQŒå¹´ä»½ï¼Œæ¼”唱者等½{‰ã€?/p>

åŸÞZºŽå匘q‡æ×o的推è?/span>

éšç€ Web2.0 çš„å‘展,Web 站点更加æå€¡ç”¨æˆ·å‚与和用户贡献åQŒå› æ­¤åŸºäºŽååŒè¿‡æ»¤çš„æŽ¨è机制因è¿è€Œç”Ÿã€‚它的原ç†å¾ˆ½Ž€å•,ž®±æ˜¯æ ÒŽ®ç”¨æˆ·å¯¹ç‰©å“æˆ–者信æ¯çš„å好åQŒå‘çŽ°ç‰©å“æˆ–者内å®ÒŽœ¬íw«çš„相关性,或者是å‘现用户的相å…Ïx€§ï¼Œç„¶åŽå†åŸºäºŽè¿™äº›å…³è”性进行推è。基于ååŒè¿‡æ»¤çš„æŽ¨èå¯ä»¥åˆ†äؓ三个å­ç±»åQšåŸºäºŽç”¨æˆïLš„æŽ¨èåQˆUser-based RecommendationåQ‰ï¼ŒåŸÞZºŽ™å¹ç›®çš„æŽ¨è(Item-based RecommendationåQ‰å’ŒåŸÞZºŽæ¨¡åž‹çš„æŽ¨è(Model-based RecommendationåQ‰ã€‚䏋颿ˆ‘们一个一个详¾l†çš„介ç»ç€ä¸‰ç§å匘q‡æ×oçš„æŽ¨èæœºåˆ¶ã€?/p>

åŸÞZºŽç”¨æˆ·çš„ååŒè¿‡æ»¤æŽ¨è?/strong>

åŸÞZºŽç”¨æˆ·çš„ååŒè¿‡æ»¤æŽ¨èçš„åŸºæœ¬åŽŸç†æ˜¯ï¼Œæ ÒŽ®æ‰€æœ‰ç”¨æˆ·å¯¹ç‰©å“æˆ–者信æ¯çš„å好åQŒå‘çŽîC¸Žå½“å‰ç”¨æˆ·å£å‘³å’Œå好相似的“邻居â€ç”¨æˆïL¾¤åQŒåœ¨ä¸€èˆ¬çš„应用中是采用计算“K- é‚Õd±…â€çš„½Ž—法åQ›ç„¶åŽï¼ŒåŸÞZºŽ˜q?K 个邻居的历å²å好信æ¯åQŒäؓ当å‰ç”¨æˆ·˜q›è¡ŒæŽ¨è。下å›?4 ¾l™å‡ºäº†åŽŸç†å›¾ã€?/p>
å›?4. åŸÞZºŽç”¨æˆ·çš„ååŒè¿‡æ»¤æŽ¨è机制的基本原ç†
å›?4. åŸÞZºŽç”¨æˆ·çš„ååŒè¿‡æ»¤æŽ¨èæœºåˆ¶çš„åŸºæœ¬åŽŸç† Â 

上图½Cºæ„出基于用æˆïLš„å匘q‡æ×oæŽ¨èæœºåˆ¶çš„基本原ç†ï¼Œå‡è®¾ç”¨æˆ· A å–œæ¬¢ç‰©å“ AåQŒç‰©å“?CåQŒç”¨æˆ?B å–œæ¬¢ç‰©å“ BåQŒç”¨æˆ?C å–œæ¬¢ç‰©å“ A åQŒç‰©å“?C 和物å“?DåQ›ä»Ž˜q™äº›ç”¨æˆ·çš„历å²å–œå¥½ä¿¡æ¯ä¸­åQŒæˆ‘们å¯ä»¥å‘现用æˆ?A 和用æˆ?C çš„å£å‘›_’Œå好是比较类似的åQŒåŒæ—¶ç”¨æˆ?C ˜q˜å–œ‹Æ¢ç‰©å“?DåQŒé‚£ä¹ˆæˆ‘们å¯ä»¥æŽ¨æ–­ç”¨æˆ?A å¯èƒ½ä¹Ÿå–œ‹Æ¢ç‰©å“?DåQŒå› æ­¤å¯ä»¥å°†ç‰©å“ D 推è¾l™ç”¨æˆ?Aã€?/p>

åŸÞZºŽç”¨æˆ·çš„ååŒè¿‡æ»¤æŽ¨è机制和åŸÞZºŽäººå£¾lŸè®¡å­¦çš„æŽ¨è机制都是计算用户的相似度åQŒåƈåŸÞZºŽâ€œé‚»å±…â€ç”¨æˆïL¾¤è®¡ç®—推èåQŒä½†å®ƒä»¬æ‰€ä¸åŒçš„æ˜¯å¦‚何计算用户的相似度åQŒåŸºäºŽähå£ç»Ÿè®¡å­¦çš„æœºåˆ¶åªè€ƒè™‘用户本èín的特å¾ï¼Œè€ŒåŸºäºŽç”¨æˆïLš„å匘q‡æ×oæœºåˆ¶å¯æ˜¯åœ¨ç”¨æˆïLš„历å²å好的数æ®ä¸Šè®¡ç®—用户的相似度åQŒå®ƒçš„基本å‡è®¾æ˜¯åQŒå–œ‹Æ¢ç±»ä¼¼ç‰©å“的用户å¯èƒ½æœ‰ç›¸åŒæˆ–者相似的å£å‘³å’Œå好ã€?/p>

åŸÞZºŽ™å¹ç›®çš„ååŒè¿‡æ»¤æŽ¨è?/strong>

åŸÞZºŽ™å¹ç›®çš„ååŒè¿‡æ»¤æŽ¨è的基本原ç†ä¹Ÿæ˜¯¾cÖM¼¼çš„ï¼Œåªæ˜¯è¯´å®ƒä½¿ç”¨æ‰€æœ‰ç”¨æˆ·å¯¹ç‰©å“或者信æ¯çš„å好åQŒå‘现物å“和物å“之间的相似度åQŒç„¶åŽæ ¹æ®ç”¨æˆïLš„历å²å好信æ¯åQŒå°†¾cÖM¼¼çš„ç‰©å“æŽ¨è给用户åQŒå›¾ 5 很好的诠释了它的基本原ç†ã€?/p>

å‡è®¾ç”¨æˆ· A å–œæ¬¢ç‰©å“ A 和物å“?CåQŒç”¨æˆ?B å–œæ¬¢ç‰©å“ AåQŒç‰©å“?B 和物å“?CåQŒç”¨æˆ?C å–œæ¬¢ç‰©å“ AåQŒä»Ž˜q™äº›ç”¨æˆ·çš„历å²å–œå¥½å¯ä»¥åˆ†æžå‡ºç‰©å“ A 和物å“?C 时比较类似的åQŒå–œ‹Æ¢ç‰©å“?A çš„äh都喜‹Æ¢ç‰©å“?CåQŒåŸºäºŽè¿™ä¸ªæ•°æ®å¯ä»¥æŽ¨æ–­ç”¨æˆ?C 很有å¯èƒ½ä¹Ÿå–œ‹Æ¢ç‰©å“?CåQŒæ‰€ä»¥ç³»¾lŸä¼šž®†ç‰©å“?C 推è¾l™ç”¨æˆ?Cã€?/p>

与上é¢è®²çš„ç±»ä¼û|¼ŒåŸÞZºŽ™å¹ç›®çš„ååŒè¿‡æ»¤æŽ¨èå’ŒåŸÞZºŽå†…容的推è其实都是基于物å“相似度预测推èåQŒåªæ˜¯ç›¸ä¼¼åº¦è®¡ç®—的方法ä¸ä¸€æ øP¼Œå‰è€…是从用户历å²çš„å好推断åQŒè€ŒåŽè€…是åŸÞZºŽç‰©å“本èín的属性特å¾ä¿¡æ¯ã€?/p>
å›?5. åŸÞZºŽ™å¹ç›®çš„ååŒè¿‡æ»¤æŽ¨è机制的基本原ç†
å›?5. åŸÞZºŽ™å¹ç›®çš„ååŒè¿‡æ»¤æŽ¨èæœºåˆ¶çš„åŸºæœ¬åŽŸç† Â 

åŒæ—¶å匘q‡æ×oåQŒåœ¨åŸÞZºŽç”¨æˆ·å’ŒåŸºäºŽé¡¹ç›®ä¸¤ä¸ªç­–略中应该如何选择呢?其实åŸÞZºŽ™å¹ç›®çš„ååŒè¿‡æ»¤æŽ¨è机制是 Amazon 在基于用æˆïLš„æœºåˆ¶ä¸Šæ”¹è‰¯çš„一¿Uç­–ç•¥ï¼Œå› äØ“åœ¨å¤§éƒ¨åˆ†çš?Web 站点中,物å“的个数是˜qœè¿œž®äºŽç”¨æˆ·çš„æ•°é‡çš„åQŒè€Œä¸”物å“çš„ä¸ªæ•°å’Œç›æ€¼¼åº¦ç›¸å¯Òޝ”è¾ƒç¨³å®šï¼ŒåŒæ—¶åŸÞZºŽ™å¹ç›®çš„æœºåˆ¶æ¯”åŸÞZºŽç”¨æˆ·çš„å®žæ—¶æ€§æ›´å¥½ä¸€äº›ã€‚ä½†ä¹Ÿä¸æ˜¯æ‰€æœ‰çš„场景都是˜q™æ ·çš„æƒ…况,å¯ä»¥è®¾æƒ³ä¸€ä¸‹åœ¨ä¸€äº›æ–°é—ÀLލèç³»¾lŸä¸­åQŒä¹Ÿè®¸ç‰©å“,也就是新é—Èš„个数å¯èƒ½å¤§äºŽç”¨æˆ·çš„个敎ͼŒè€Œä¸”新闻的更新程度也有很快,所以它的åŞ似度ä¾ç„¶ä¸ç¨³å®šã€‚所以,其实å¯ä»¥çœ‹å‡ºåQŒæŽ¨è策略的选择其实和具体的应用场景有很大的关系ã€?/p>

åŸÞZºŽæ¨¡åž‹çš„ååŒè¿‡æ»¤æŽ¨è?/strong>

åŸÞZºŽæ¨¡åž‹çš„ååŒè¿‡æ»¤æŽ¨è就是基于样本的用户喜好信æ¯åQŒè®­¾lƒä¸€ä¸ªæŽ¨èæ¨¡åž‹ï¼Œç„¶åŽæ ÒŽ®å®žæ—¶çš„ç”¨æˆ·å–œå¥½çš„ä¿¡æ¯˜q›è¡Œé¢„测åQŒè®¡½Ž—推èã€?/p>

åŸÞZºŽå匘q‡æ×oçš„æŽ¨èæœºåˆ¶æ˜¯çŽîC»Šåº”ç”¨æœ€ä¸ºå¹¿æ³›çš„æŽ¨èæœºåˆ¶åQŒå®ƒæœ‰ä»¥ä¸‹å‡ ä¸ªæ˜¾è‘—的优点åQ?/p>

  1. 它ä¸éœ€è¦å¯¹ç‰©å“或者用戯‚¿›è¡Œä¸¥æ ¼çš„建模åQŒè€Œä¸”ä¸è¦æ±‚物å“çš„æè¿°æ˜¯æœºå™¨å¯ç†è§£çš„,所以这¿U方法也是领域无关的ã€?/li>
  2. ˜q™ç§æ–ÒŽ³•计算出æ¥çš„æŽ¨è是开攄¡š„åQŒå¯ä»¥å…±ç”¨ä»–人的¾l验åQŒå¾ˆå¥½çš„æ”¯æŒç”¨æˆ·å‘现潜在的兴­‘£åå¥?/li>

而它也存在以下几个问题:

  1. æ–ÒŽ³•的核心是åŸÞZºŽåކ岿•°æ®åQŒæ‰€ä»¥å¯¹æ–°ç‰©å“和新用户都有“冷å¯åЍâ€çš„问题ã€?/li>
  2. 推è的效果ä¾èµ–于用户历å²å好数æ®çš„多ž®‘和准确性ã€?/li>
  3. 在大部分的实çŽîC¸­åQŒç”¨æˆ·åކå²å好是用稀ç–矩阵进行存储的åQŒè€Œç¨€ç–矩阵上的计½Ž—有些明昄¡š„问题åQŒåŒ…括å¯èƒ½å°‘部分人的错误å好会对推è的准¼‹®åº¦æœ‰å¾ˆå¤§çš„影哽{‰ç­‰ã€?/li>
  4. 对于一些特ŒDŠå“味的用户ä¸èƒ½¾l™äºˆå¾ˆå¥½çš„æŽ¨èã€?/li>
  5. ç”׃ºŽä»¥åކ岿•°æ®äؓ基础åQŒæŠ“å–和建模用户的å好åŽåQŒå¾ˆéš¾ä¿®æ”ÒŽˆ–者根æ®ç”¨æˆïLš„使用演å˜åQŒä»Žè€Œå¯¼è‡´è¿™ä¸ªæ–¹æ³•ä¸å¤Ÿçµ‹z…R€?/li>

æ··åˆçš„æŽ¨è机åˆ?/span>

在现行的 Web 站点上的推èå¾€å¾€éƒ½ä¸æ˜¯å•¾U¯åªé‡‡ç”¨äº†æŸä¸€¿U推è的机制和策略,他们往往是将多个æ–ÒŽ³•æ··åˆåœ¨ä¸€èµøP¼Œä»Žè€Œè¾¾åˆ°æ›´å¥½çš„æŽ¨è效果。关于如何组åˆå„ä¸ªæŽ¨èæœºåˆÓž¼Œ˜q™é‡Œè®²å‡ ¿U比较æµè¡Œçš„¾l„åˆæ–ÒŽ³•ã€?/p>

  1. 加æƒçš„æØœåˆï¼ˆWeighted HybridizationåQ? 用线性公å¼ï¼ˆlinear formulaåQ‰å°†å‡ ç§ä¸åŒçš„æŽ¨è按照一定æƒé‡ç»„åˆè“væ¥ï¼Œå…·ä½“æƒé‡çš„值需è¦åœ¨‹¹‹è¯•æ•°æ®é›†ä¸Šåå¤å®žéªŒåQŒä»Žè€Œè¾¾åˆ°æœ€å¥½çš„æŽ¨è效果ã€?/li>
  2. 切æ¢çš„æØœåˆï¼ˆSwitching HybridizationåQ‰ï¼šå‰é¢ä¹Ÿè®²åˆŽÍ¼Œå…¶å®žå¯¹äºŽä¸åŒçš„æƒ…况(数æ®é‡ï¼Œ¾pÈ»Ÿ˜q行状况åQŒç”¨æˆ·å’Œç‰©å“的数目等åQ‰ï¼ŒæŽ¨è½{–ç•¥å¯èƒ½æœ‰å¾ˆå¤§çš„ä¸åŒåQŒé‚£ä¹ˆåˆ‡æ¢çš„æ··åˆæ–¹å¼åQŒå°±æ˜¯å…许在ä¸åŒçš„æƒ…况下åQŒé€‰æ‹©æœ€ä¸ºåˆé€‚çš„æŽ¨èæœºåˆ¶è®¡ç®—推èã€?/li>
  3. åˆ†åŒºçš„æØœåˆï¼ˆMixed HybridizationåQ‰ï¼šé‡‡ç”¨å¤šç§æŽ¨è机制åQŒåƈž®†ä¸åŒçš„æŽ¨è¾l“果分ä¸åŒçš„区显½Cºç»™ç”¨æˆ·ã€‚其实,AmazonåQŒå½“当网½{‰å¾ˆå¤šç”µå­å•†åŠ¡ç½‘ç«™éƒ½æ˜¯é‡‡ç”¨è¿™æ ïLš„æ–¹å¼åQŒç”¨æˆ·å¯ä»¥å¾—到很全é¢çš„æŽ¨è,也更å®ÒŽ˜“扑ֈ°ä»–们惌™¦çš„东è¥Ñ€?/li>
  4. åˆ†å±‚çš„æØœåˆï¼ˆMeta-Level HybridizationåQ? é‡‡ç”¨å¤šç§æŽ¨èæœºåˆ¶åQŒåƈž®†ä¸€ä¸ªæŽ¨è机制的¾l“æžœä½œäØ“å¦ä¸€ä¸ªçš„输入åQŒä»Žè€Œç»¼åˆå„ä¸ªæŽ¨èæœºåˆ¶çš„优缺点,得到更加准确的推èã€?/li>

推è引擎的应ç”?/span>

介ç»å®ŒæŽ¨è引擎的基本原ç†åQŒåŸºæœ¬æŽ¨è机åˆÓž¼Œä¸‹é¢½Ž€è¦åˆ†æžå‡ ä¸ªæœ‰ä»£è¡¨æ€§çš„æŽ¨è引擎的应用,˜q™é‡Œé€‰æ‹©ä¸¤ä¸ªé¢†åŸŸåQšAmazon ä½œäØ“ç”µå­å•†åŠ¡çš„ä»£è¡¨ï¼Œè±†ç“£ä½œäØ“½C¾äº¤¾|‘络的代表ã€?/p>

推è在电å­å•†åŠ¡ä¸­çš„åº”ç”?â€?Amazon

Amazon ä½œäØ“æŽ¨è引擎的éËE¼œ–,它已¾l将推èçš„æ€æƒ³æ¸—é€åœ¨åº”用的å„个角è½ã€‚Amazon 推èçš„æ ¸å¿ƒæ˜¯é€šè¿‡æ•°æ®æŒ–掘½Ž—法和比较用æˆïLš„æ¶ˆè´¹å好于其他用戯‚¿›è¡Œå¯¹æ¯”,借以预测用户å¯èƒ½æ„Ÿå…´­‘£çš„商å“。对应于上é¢ä»‹ç»çš„å„¿UæŽ¨èæœºåˆÓž¼ŒAmazon é‡‡ç”¨çš„æ˜¯åˆ†åŒºçš„æØœåˆçš„æœºåˆ¶åQŒåƈž®†ä¸åŒçš„æŽ¨è¾l“果分ä¸åŒçš„区显½Cºç»™ç”¨æˆ·åQŒå›¾ 6 和图 7 展示了用户在 Amazon 上能得到的推èã€?/p>
å›?6. Amazon çš„æŽ¨èæœºåˆ?- 首页
å›?6. Amazon çš„æŽ¨èæœºåˆ?- 首页  

å›?7. Amazon çš„æŽ¨èæœºåˆ?- ‹¹è§ˆç‰©å“
å›?7. Amazon çš„æŽ¨èæœºåˆ?- ‹¹è§ˆç‰©å“  

Amazon 利用å¯ä»¥è®°å½•çš„æ‰€æœ‰ç”¨æˆ·åœ¨ç«™ç‚¹ä¸Šçš„è¡ŒäØ“åQŒæ ¹æ®ä¸åŒæ•°æ®çš„特点对它们进行处ç†ï¼Œòq¶åˆ†æˆä¸åŒåŒºä¸ºç”¨æˆähލ逿ލè:

  • 今日推è (Today's Recommendation For You): 通常是根æ®ç”¨æˆïLš„˜q‘期的历å²è´­ä¹°æˆ–者查看记录,òq¶ç»“åˆæ—¶ä¸‹æµè¡Œçš„物哾l™å‡ºä¸€ä¸ªæŠ˜ä¸­çš„æŽ¨èã€?/li>
  • æ–îCñ”å“的推è (New For You): é‡‡ç”¨äº†åŸºäºŽå†…å®¹çš„æŽ¨èæœºåˆ¶ (Content-based Recommendation)åQŒå°†ä¸€äº›æ–°åˆ°ç‰©å“推è给用户。在æ–ÒŽ³•é€‰æ‹©ä¸Šç”±äºŽæ–°ç‰©å“æ²¡æœ‰å¤§é‡çš„用户喜好信æ¯ï¼Œæ‰€ä»¥åŸºäºŽå†…容的推è能很好的解决˜q™ä¸ªâ€œå†·å¯åЍâ€çš„问题ã€?/li>
  • æ†ç»‘销å”?(Frequently Bought Together): é‡‡ç”¨æ•°æ®æŒ–æŽ˜æŠ€æœ¯å¯¹ç”¨æˆ·çš„è´­ä¹°è¡Œä¸ø™¿›è¡Œåˆ†æžï¼Œæ‰‘Öˆ°¾l常被一èµähˆ–åŒä¸€ä¸ªäh购买的物å“集åQŒè¿›è¡Œæ†¾l‘销售,˜q™æ˜¯ä¸€¿U典型的åŸÞZºŽ™å¹ç›®çš„ååŒè¿‡æ»¤æŽ¨è机制ã€?/li>
  • 别ähè´­ä¹° / ‹¹è§ˆçš„商å“?(Customers Who Bought/See This Item Also Bought/See): ˜q™ä¹Ÿæ˜¯ä¸€ä¸ªå…¸åž‹çš„åŸÞZºŽ™å¹ç›®çš„ååŒè¿‡æ»¤æŽ¨è的应用åQŒé€šè¿‡½C¾ä¼šåŒ–机制用戯‚ƒ½æ›´å¿«æ›´æ–¹ä¾¿çš„æ‰‘Öˆ°è‡ªå·±æ„Ÿå…´­‘£çš„物å“ã€?/li>

值得一æçš„æ˜¯ï¼ŒAmazon åœ¨åšæŽ¨èæ—Óž¼Œè®¾è®¡å’Œç”¨æˆ·ä½“验也åšå¾—特别独到åQ?/p>

Amazon 利用有它大é‡åކ岿•°æ®çš„优势,é‡åŒ–推è原因ã€?/p>

  • åŸÞZºŽ½C¾ä¼šåŒ–的推èåQŒAmazon 会给你事实的数æ®åQŒè®©ç”¨æˆ·ä¿¡æœåQŒä¾‹å¦‚:购买此物å“的用户癑ֈ†ä¹‹å¤šž®‘也购买了那个物å“ï¼›
  • åŸÞZºŽç‰©å“本èín的推è,Amazon 也会列出推èçš„ç†ç”±ï¼Œä¾‹å¦‚åQšå› ä¸ÞZ½ çš„购物框中有 ***åQŒæˆ–者因ä¸ÞZ½ è´­ä¹°˜q?***åQŒæ‰€ä»¥ç»™ä½ æŽ¨è类似的 ***ã€?/li>

å¦å¤–åQŒAmazon å¾ˆå¤šæŽ¨èæ˜¯åŸºäºŽç”¨æˆïLš„ profile 计算出æ¥çš„,用户çš?profile 中记录了用户åœ?Amazon ä¸Šçš„è¡ŒäØ“åQŒåŒ…括看了那些物å“,ä¹îCº†é‚£äº›ç‰©å“åQŒæ”¶è—夹å’?wish list 里的物哽{‰ç­‰åQŒå½“ç„?Amazon 里还集æˆäº†è¯„分等其他的用户å馈的方å¼åQŒå®ƒä»¬éƒ½æ˜?profile 的一部分åQŒåŒæ—Óž¼ŒAmazon æä¾›äº†è®©ç”¨æˆ·è‡ªä¸»½Ž¡ç†è‡ªå·± profile 的功能,通过˜q™ç§æ–¹å¼ç”¨æˆ·å¯ä»¥æ›´æ˜Ž¼‹®çš„告诉推è引擎他的å“味和æ„图是什么ã€?/p>

推è在社交网站中的应ç”?â€?豆瓣

豆瓣是国内åšçš„æ¯”较æˆåŠŸçš„½C¾äº¤¾|‘ç«™åQŒå®ƒä»¥å›¾ä¹¦ï¼Œç”µåª„åQŒéŸ³ä¹å’ŒåŒåŸŽ‹zÕdЍä¸ÞZ¸­å¿ƒï¼Œå½¢æˆä¸€ä¸ªå¤šå…ƒåŒ–的社交网¾lœåã^åŽÍ¼Œè‡ªç„¶æŽ¨è的功能是必ä¸å¯å°‘çš„ï¼Œä¸‹é¢æˆ‘们看看豆瓣是如何推èçš„ã€?/p>
å›?8 . è±†ç“£çš„æŽ¨èæœºåˆ?- 豆瓣电媄
å›?8 . è±†ç“£çš„æŽ¨èæœºåˆ?- 豆瓣电媄  

当你在豆瓣电å½×ƒ¸­ž®†ä¸€äº›ä½ çœ‹è¿‡çš„æˆ–是感兴趣的电影加入你看过和想看的列表里,òq¶äؓ它们åšç›¸åº”的评分åQŒè¿™æ—¶è±†ç“£çš„æŽ¨èå¼•æ“Žå·²ç»æ‹¿åˆ°ä½ çš„一些å好信æ¯ï¼Œé‚£ä¹ˆå®ƒå°†¾l™ä½ å±•示如图 8 的电影推èã€?/p>
å›?9 . è±†ç“£çš„æŽ¨èæœºåˆ?- åŸÞZºŽç”¨æˆ·å“味的推è?/b>
å›?9 . è±†ç“£çš„æŽ¨èæœºåˆ?- åŸÞZºŽç”¨æˆ·å“味的推è? src=  

è±†ç“£çš„æŽ¨èæ˜¯é€šè¿‡â€œè±†ç“£çŒœâ€ï¼Œä¸ÞZº†è®©ç”¨æˆäh¸…æ¥šè¿™äº›æŽ¨èæ˜¯å¦‚何æ¥çš„åQŒè±†ç“£è¿˜¾l™å‡ºäº†â€œè±†ç“£çŒœâ€çš„一个简è¦çš„介ç»ã€?/p>

â€?/em> 你的个ähæŽ¨èæ˜¯æ ¹æ®ä½ çš„æ”¶è—和评ä­h自动得出的,æ¯ä¸ªäººçš„æŽ¨è清å•都ä¸åŒã€‚你的收è—和评ä­h­‘Šå¤šåQŒè±†ç“£ç»™ä½ çš„æŽ¨è会越准确和丰富ã€?/em>
æ¯å¤©æŽ¨è的内容å¯èƒ½ä¼šæœ‰å˜åŒ–。éšç€è±†ç“£çš„长大,¾l™ä½ æŽ¨è的内容也会越æ¥è¶Šå‡†ã€?/em> â€?/em>

˜q™ä¸€ç‚¹è®©æˆ‘们å¯ä»¥æ¸…晰明了的知é“,豆瓣必然是基于社会化的ååŒè¿‡æ»¤çš„æŽ¨èåQŒè¿™æ ïL”¨æˆ¯‚¶Šå¤šï¼Œç”¨æˆ·çš„å馈越多,那么推è的效果会­‘Šæ¥­‘Šå‡†¼‹®ã€?/p>

相对äº?Amazon 的用戯‚¡Œä¸ºæ¨¡åž‹ï¼Œè±†ç“£ç”µåª„的模型更加简å•,ž®±æ˜¯â€œçœ‹˜q‡â€å’Œâ€œæƒ³çœ‹â€ï¼Œ˜q™ä¹Ÿè®©ä»–ä»¬çš„æŽ¨èæ›´åŠ ä¸“æ³¨äºŽç”¨æˆïLš„å“味åQŒæ¯•ç«Ÿä¹°ä¸œè¥¿å’Œçœ‹ç”µåª„çš„åŠ¨æœø™¿˜æ˜¯æœ‰å¾ˆå¤§ä¸åŒçš„ã€?/p>

å¦å¤–åQŒè±†ç“£ä¹Ÿæœ‰åŸºäºŽç‰©å“本íw«çš„æŽ¨èåQŒå½“你查看一些电å½Þqš„详细信æ¯çš„æ—¶å€™ï¼Œä»–会¾l™ä½ æŽ¨è出“喜‹Æ¢è¿™ä¸ªç”µå½Þqš„äºÞZ¹Ÿå–œæ¬¢çš„电影â€ï¼Œ 如图 10åQŒè¿™æ˜¯ä¸€ä¸ªåŸºäºŽååŒè¿‡æ»¤çš„应用ã€?/p>
å›?10 . è±†ç“£çš„æŽ¨èæœºåˆ?- åŸÞZºŽç”µåª„本èín的推è?/b>
å›?10 . è±†ç“£çš„æŽ¨èæœºåˆ?- åŸÞZºŽç”µåª„本èín的推è? src=  

æ€È»“

在网¾lœæ•°æ®çˆ†ç‚¸çš„òq´ä»£åQŒå¦‚何让用户更快的找到想è¦çš„æ•°æ®åQŒå¦‚何让用户å‘现自己潜在的兴­‘£å’Œéœ€æ±‚,无论是对于电å­å•†åŠ¡è¿˜æ˜¯ç¤¾ä¼šç½‘¾lœçš„应用都是臛_…³é‡è¦çš„。推è引擎的出现åQŒä‹É得这个问题越æ¥è¶Šè¢«å¤§å®¶å…³æ³¨ã€‚但对大多数人æ¥è®ÔŒ¼Œä¹Ÿè®¸˜q˜åœ¨æƒŠå¹å®ƒäؓ什么æ€ÀL˜¯èƒ½çŒœåˆîC½ åˆ°åº•惌™¦äº›ä»€ä¹ˆã€‚推è引擎的™ì”åŠ›åœ¨äºŽä½ ä¸æ¸…楚在这个推è背åŽï¼Œå¼•擎到底记录和推ç†äº†äº›ä»€ä¹ˆã€?/p>

通过˜q™ç¯‡¾lÆD¿°æ€§çš„æ–‡ç« åQŒä½ å¯ä»¥äº†è§£åQŒå…¶å®žæŽ¨èå¼•æ“Žåªæ˜¯é»˜é»˜çš„记录和观察你的一举一动,然åŽå†å€Ÿç”±æ‰€æœ‰ç”¨æˆ·äñ”生的‹¹·é‡æ•°æ®åˆ†æžå’Œå‘现其中的规律åQŒè¿›è€Œæ…¢æ…¢çš„了解你,你的需求,你的习惯åQŒåƈ默默的无声æ¯çš„帮助你快速的解决你的问题åQŒæ‰¾åˆîC½ æƒŒ™¦çš„东è¥Ñ€?/p>

其实åQŒå›žå¤´æƒ³æƒ»I¼Œå¾ˆå¤šæ—¶å€™ï¼ŒæŽ¨è引擎比你更了解你自己ã€?/p>

通过½W¬ä¸€½‹‡æ–‡ç« ï¼Œç›æ€¿¡å¤§å®¶å¯ÒŽŽ¨è引擎有一个清晰的½W¬ä¸€å°è±¡åQŒæœ¬¾pÕdˆ—的下一½‹‡æ–‡ç« å°†æ·±å…¥ä»‹ç»åŸÞZºŽå匘q‡æ×o的推è策略。在çŽîC»Šçš„æŽ¨è技术和½Ž—法中,最被大家广泛认å¯å’Œé‡‡ç”¨çš„就是基于ååŒè¿‡æ»¤çš„æŽ¨èæ–ÒŽ³•。它以其æ–ÒŽ³•模型½Ž€å•,数æ®ä¾èµ–性低åQŒæ•°æ®æ–¹ä¾‰K‡‡é›†ï¼ŒæŽ¨è效果较优½{‰å¤šä¸ªä¼˜ç‚ÒŽˆä¸ºå¤§ä¼—眼里的推轎—法“No.1â€ã€‚本文将带你深入了解å匘q‡æ×o的秘密,òq¶ç»™å‡ºåŸºäº?Apache Mahout çš„ååŒè¿‡æ»¤ç®—法的高效实现。Apache Mahout æ˜?ASF 的一个较新的开æºé¡¹ç›®ï¼Œå®ƒæºäº?LuceneåQŒæž„建在 Hadoop 之上åQŒå…³æ³¨æ“v釿•°æ®ä¸Šçš„æœºå™¨å­¦ä¹ ç»å…¸ç®—法的高效实现ã€?/p>

感谢大家å¯ÒŽœ¬¾pÕdˆ—的关注和支æŒã€?/p>

声明

本äh所å‘表的内容仅ä¸ÞZ¸ªäºø™§‚点,ä¸ä»£è¡?IBM å…¬å¸ç«‹åœºã€æˆ˜ç•¥å’Œè§‚点ã€?/p>

å‚考资æ–?/span>

学习

讨论



]]>
Ö÷Õ¾Ö©Öë³ØÄ£°å£º »ôÇñÏØ| °²ÈÊÏØ| »¨Ô«ÏØ| ²©°×ÏØ| ÉÇβÊÐ| Ì©°²ÊÐ| ÕòÔ­ÏØ| á³á°ÏØ| ¼¨ÏªÏØ| ½­¿ÚÏØ| Çð±±ÏØ| ÇåÔ·ÏØ| ·Ê¶«ÏØ| Ñ×ÁêÏØ| Î÷²ýÊÐ| ÈÊ»³ÊÐ| ¾ÆÈªÊÐ| ÕÑͨÊÐ| ÈÀÌÁÏØ| À³ÖÝÊÐ| ÏÉÌÒÊÐ| ÎäÒåÏØ| ãôÑôÏØ| Æ«¹ØÏØ| ÇúÑôÏØ| ÁøÖÝÊÐ| µÂÇÕÏØ| ½ðÉ½Çø| ³Î½­ÏØ| ¿ª·âÊÐ| Ìì¾þÏØ| ·ÖÒËÏØ| ¤ÄÏÊÐ| ºÍË³ÏØ| ²©°×ÏØ| ÕÅÒ´ÊÐ| ²©Ò°ÏØ| ̨°²ÏØ| Îâ½­ÊÐ| Óå±±Çø| ÄÚ½­ÊÐ|