搜索引擎是網(wǎng)絡(luò)時代應(yīng)用最廣,作用最大的應(yīng)用軟件之一,是資訊來源的主要通道,搜索引擎是網(wǎng)絡(luò)的主要交匯點,網(wǎng)站的網(wǎng)頁所包含的資訊和服務(wù)是構(gòu)成網(wǎng)絡(luò)海洋的水滴,一滴滴不計其數(shù)的水滴由搜索引擎這個主要交匯點、通過瀏覽器這個管道匯聚成為網(wǎng)絡(luò)的海洋。微軟首席軟件設(shè)計師Ray Ozzie在給其員工一份備忘錄中表示,微軟公司正在接受一種新的認知。“在過去10年中,PC時代已經(jīng)讓位給另一個時代,WEB時代。不僅可以通過瀏覽器獲得WEB體驗,通過其他不同的設(shè)備也可以獲得WEB體驗,例如電腦、電話、媒體播放器、游戲機、機頂盒和電視、汽車等等。”在備忘錄中,Ozzie描述了三項原則,以指引該公司進入這個新的時代。其中的主要概念是,“WEB是我們的社會網(wǎng)格和設(shè)備網(wǎng)絡(luò)的樞紐”。
手機的移動搜索:通常指的是建立在WAP應(yīng)用之上的資訊搜索,搜索的對象為WAP網(wǎng)站上的內(nèi)容和服務(wù)。如百度的移動搜索:據(jù)報道,百度將同多家中國主要電信運營商合作,共同為即將在中國推出的3G服務(wù)開發(fā)手機搜索應(yīng)用,以此迎擊Google的手機計劃。用戶可以通過百度WAP門戶(wap.baidu.com)訪問一系列服務(wù),包括網(wǎng)絡(luò)搜索、新聞、手機博客、地圖、圖片、字典、以及股票信息等等。在中國互聯(lián)網(wǎng)搜索市場,百度已經(jīng)占據(jù)了絕對的領(lǐng)先優(yōu)勢,遙遙領(lǐng)先于Google。百度在中國手機搜索領(lǐng)域,得益于兩年半之前通過WAP系統(tǒng)推出的數(shù)據(jù)服務(wù),百度同樣是市場領(lǐng)先者,雖然在Google與中國移動客戶搜索形成的強制性使用Google后數(shù)量上落后,但在模式和內(nèi)容的多樣性上百度還是居于領(lǐng)先地位。用戶可以通過百度WAP門戶(wap.baidu.com)訪問一系列服務(wù),包括網(wǎng)絡(luò)搜索、新聞、手機博客、地圖、圖片、字典、以及股票信息等等。由此可見,WAP門戶在百度3G計劃中占據(jù)了十分重要的位置。
手機的WEB搜索:指的是建立在WEB應(yīng)用之上的資訊搜索,搜索的對象為WEB網(wǎng)站上的內(nèi)容。Google手機搜索的WEB觀,“移動搜索和整合搜索都是可以搜索整個互聯(lián)網(wǎng)的,并不是局限于一部分的”這里的移動搜索,事實上指的是手機的WEB搜索。
第一代搜索引擎,是以雅虎為代表的目錄式搜索引擎,他實際上是一個導(dǎo)航網(wǎng)站,隨著信息量的海量增長,導(dǎo)航網(wǎng)站的搜索方式已經(jīng)明顯地?zé)o法滿足用戶對搜索引擎的要求,隨之而來的,是以“關(guān)鍵詞”搜索技術(shù)為代表的第二代搜索引擎的誕生,“關(guān)鍵詞”搜索創(chuàng)新性地提出了頁面重要性分析技術(shù)pageranking技術(shù)和超鏈分析技術(shù)等,將最重要的頁面優(yōu)先呈現(xiàn)給用戶。代表產(chǎn)品就是Google,在方法上它并不對文獻本身按目錄進行分類,而是從文獻中識別出“關(guān)鍵字”來,然后建立倒排索引,從而造就了Google帝國。第二代搜索引擎設(shè)計的三大要素:
1、資訊的獲取,也就是通過搜索引擎派出去的網(wǎng)絡(luò)蜘蛛(即WEB Spider)在網(wǎng)海之中有計劃地對散存在各處的網(wǎng)頁完成對網(wǎng)頁內(nèi)容的抓取,由他決定了那些資訊可進入搜索引擎的數(shù)據(jù)庫中,其主要指標為:抓取的速度、抓取的深度和抓取的廣度。
2、資訊的處理:抓來的海量資訊如何排序?按什么原則?用什么方法?如何分類?3、向搜索引擎用戶提供反饋結(jié)果,按關(guān)鍵詞和排序算法把結(jié)果按一定規(guī)則形成的優(yōu)先級在網(wǎng)頁上顯示用戶查詢結(jié)果,這里也涉及效率問題,即用快速檢索算法,用最短的時間讓用戶看到結(jié)果。衡量一個搜索引擎的好壞主要是搜索精度指標和數(shù)據(jù)處理的效率,讓用戶用最短的時間,最便捷的方式獲得他所需要的最新的資訊。
隨著時間的推移,網(wǎng)上資訊的指數(shù)式增長,綜合搜索引擎,如Google、百度等,在海量資訊的面前,遇到了一個很大的麻煩--搜索精度嚴重不足,表現(xiàn)在用戶在使用綜合搜索引擎時面對數(shù)以百萬計的答案茫然不知所措,量變終于又造成了質(zhì)變,關(guān)鍵詞搜索模式開始遇到了一個致命的問題——搜索的精度問題無法解決,有人統(tǒng)計過,使用Google搜索實現(xiàn)用戶查知所需資訊的時間平均為6分鐘,如何解決這個問題,成為現(xiàn)實中的實際需求,因此,各搜索引擎無不把如何解決這一問題作為自己的目標,因為他們深知,解決了用戶的問題,就等于造就了自己。
目前各搜索引擎的解決方案,都是基于增加細化分類來實現(xiàn)這一目的,其原理可用以下分式來表示:
搜索精度=符合條件的資訊總量/細化分類之?dāng)?shù)目
每增加一個細化分類,就能使精度提高一倍。
這種方式雖然能起到一定的效果,但由于分子過大,而分母無法過分的增加,否則將會造成分細過多,從而引發(fā)另一個不便之處,所以,還是不能從根本上解決問題。綜合搜索引擎對此一籌莫展,始終無法解決搜索精度的問題,問題的出現(xiàn)和用戶的需求,摧生了垂直搜索引擎,所以,在這個問題的解決方案中,根據(jù)市場細分原理,催生了垂直搜索,垂直型搜索引擎由此應(yīng)然而生,他們面向的分類對象五花八門,粗粗一看,通過市場細分,有效地縮小了公式中的分子,似乎解決了綜合搜索引擎搜索精度不足的問題,這一結(jié)果讓垂直搜索引擎的創(chuàng)建者們興奮不已;他們在Google帝國的鼻子底下大搖大擺的公然分享Google的世襲領(lǐng)地,而Google則鞭長莫及,無可奈何,帝國,也必須尊守藍切斯特法則,在垂直引擎的差異化戰(zhàn)略面前,既然無法以同化戰(zhàn)略進行出擊,也就只能看著市場在流失,其中的關(guān)鍵,在于技術(shù),沒有技術(shù)上的創(chuàng)新來解決精度搜索問題,垂直搜索就自有生存之道。
雖然利用差異化,垂直搜索引擎瓜分了綜合搜索引擎的一部分市場,但垂直搜索卻遇到了一個自己沒想到的問題――自己居然要抽自己的嘴巴:市場分得越細,搜索精度自然高會越高,所需要的不同的搜索引擎就會越多,搜索引擎過多,一個嚴重的問題隨之而生并隱藏的水面之下,這里存在一個邏輯誤區(qū),或者將之稱為怪圈,垂直搜索引擎把市場分得越細,其搜索精度自然就越高,同時垂直搜索引擎的數(shù)量也就越多,為數(shù)眾多的垂直型搜索引擎是在一定的程度上解決了精度問題,可是,誰能指望用戶記住這n多的垂直搜索引擎呢?對用戶來說,要找到他所需要的垂直搜索引擎或許會比他在精度不足的綜合搜索引擎上尋找結(jié)果更加麻煩。
搜索引擎的搜索精度,是搜索引擎的命脈,沒有那一位用戶喜歡從一大堆垃圾資訊中尋找自己想要的結(jié)果,這個關(guān)鍵的情況,終于被百度發(fā)現(xiàn)并加以利用了,百度于是決定以中文分詞技術(shù)作為突破口,以高超的中文分詞技術(shù)為基礎(chǔ),不足部分再以人工修正為輔助,這一方案大大提高了百度搜索在分詞上的準確性,使得用戶在使用百度進行關(guān)鍵詞搜索時,百度搜索引擎所返回的其垃圾資訊大為減少,百度以此為主攻突擊方向,向Google發(fā)起了全面進攻,果然不出百度之所料,迎合用戶的需求,就是成功的基礎(chǔ),百度很快的就突破了Google的防線,在百度的中文分詞突擊集群的攻勢面前,Google則是束手無策、潰不成軍,結(jié)果,在中文搜索領(lǐng)域里,百度憑著其優(yōu)良的中文分詞效果一舉擊敗了不可一世的Google,百度并趁勢擴大戰(zhàn)果,以MP3搜索等輔助垂直搜索為領(lǐng)域,建立起了自己的一個防御體系并乘勝追擊以擴大戰(zhàn)果,這是搜索引擎大戰(zhàn)中一個關(guān)于搜索精度取勝的典型案例。
隨著3G手機網(wǎng)絡(luò)時代的到來,手機網(wǎng)絡(luò)時代讓手機搜索成為了搜索領(lǐng)域的重心,在手機上使用的搜索引擎匆匆登場,Google預(yù)言3年后手機搜索將超計算機搜索,由于與中國移動結(jié)成了聯(lián)盟,到2011年,它處理的來自中國手機用戶的搜索請求將超過計算機用戶,Google中國區(qū)總裁李開復(fù)在接受彭博電視(Bloomberg Television)采訪時表示,在一些季度中,我們的手機搜索次數(shù)會翻一番,而PC搜索次數(shù)翻一番通常需要一年時間。他說:在未來3年后,手機搜索將超過計算機搜索,Google宣布將著重手機搜索市場的布局,而其為Nokia、BlackBerry和Windows Mobile手機設(shè)計的專用搜索功能,號稱可讓手機搜索速度加快40%,Google也宣稱,新軟件已增加20%的手機上網(wǎng)比率。
就目前的情況上來看,手機的搜索引擎大體分為兩類主流模式,一類是以電腦綜合搜索為模式的簡單移植,即把電腦綜合搜索引擎幾乎是原封不動的搬到手機上,是建立在面向整個互聯(lián)網(wǎng)基礎(chǔ)上的手機WEB搜索引擎,另一類是以垂直搜索為模式,在對象上以面向WAP為應(yīng)用為基礎(chǔ),稱之為移動搜索引擎(又叫無線搜索引擎),即他搜索的元素基于WAP的整個應(yīng)用。現(xiàn)在的第二代搜索引擎技術(shù)在電腦搜索上已經(jīng)落后,使得將搜索模式移植到手機上將更加困難,在電腦搜索中所遇到的問題在手機的應(yīng)用上仍然會遇到,而在電腦搜索中并不存在的問題在手機搜索上卻會出現(xiàn)。對于WEB搜索,手機搜索與電腦搜索是有很大的區(qū)別的,主要是兩個原因所造成的,一個是手機的屏幕遠遠小于電腦屏幕,這意味著他在一屏之內(nèi)只能顯示很少的內(nèi)容,即:在電腦搜索上,一頁所顯示十條搜索結(jié)果的現(xiàn)狀,搬到手機后,他一屏只能顯示一到兩條結(jié)果(視不同大小的手機屏幕而定),對于一般的低端小屏幕手機,恐怕連一條搜索結(jié)果在一屏之內(nèi)都顯示不完,故要把在電腦搜索領(lǐng)域的海量顯示結(jié)果,在手機屏幕將其展現(xiàn)出來的結(jié)局,將使用戶查找所需條目更為困難,要另一個原因是手機主流操作還是鍵盤操作,大多數(shù)手機沒有鼠標功能,要在手機的數(shù)字鍵盤上單指進行操作,使得在操作上極為不便,所以,基于以上原因,綜合搜索引擎往手機上簡單移植的模式明顯是有重大缺陷的,只能不得已而為之的權(quán)宜之計――總比沒有搜索引擎要好。讓我們再看看移動搜索在手機上的應(yīng)用,現(xiàn)在的移動搜索,主要面向的是WAP的服務(wù)性垂直搜索,由于相對于WEB的內(nèi)容搜索而言,WAP的服務(wù)性搜索的內(nèi)容極少,還免強能用,但當(dāng)3G迫使其轉(zhuǎn)向WEB時,其缺陷立即暴露出來了,即便是采用垂直搜索的模式來對WEB進行內(nèi)容搜索,所得出的海量搜索結(jié)果也將對其產(chǎn)生致命的硬傷,而垂直搜索的另一個硬傷――多到讓人無法記住的垂直搜索引擎之間的切換,對于操作不便的手機來說,比電腦垂直搜索更為致命。
手機用戶對搜索引擎的需求方式上的特點,用戶用手機上網(wǎng)時,他的目的與用電腦上網(wǎng)時在多數(shù)情況下是有所不同的,其具體表現(xiàn)在用手機查資料的時候少,查資訊的時候多,造成這種現(xiàn)象的原因是:大多數(shù)人用手機來進行工作的時間少,用來放松和解決日常生活問題的時間多,這種判斷雖然有助于解決手機搜索設(shè)計上的部分問題,如Google的手機整合搜索的例子,李開復(fù)是這樣來描述Google的整合搜索的:“我們的整合搜索就是這樣的目的,整合搜索的概念就是將各種不同的信息的來源無論是圖片還是地圖、餐館的信息還是網(wǎng)頁進行很好的排序,當(dāng)您喜歡看一個圖片的時候,例如搜鳥巢的時候,圖片在前面,周杰倫的時候,歌曲在前面,搜長江七號的時候影評信息排在前面。移動搜索和整合搜索都是可以搜索整個互聯(lián)網(wǎng)的,并不是局限于一部分的,他們的排序會根據(jù)用戶的習(xí)慣不同,所以也許,在移動搜索中,地圖或者是找尋商店、餐館是移動用戶有興趣的,他們會被自動的排在前面,今天移動搜索的內(nèi)容和使用率不是最高,有的排序做的不是很完美的,用戶繼續(xù)使用,我們的排序越做越好的前提之下,我們相信移動搜索和PC搜索有同樣廣大的潛在的結(jié)果,會根據(jù)你個人或者是地理位置或過去的習(xí)慣做更加合理的排序,長期來說,移動搜索有更大精確排序的空間,因為移動搜索知道你的地理位置也知道過去的習(xí)慣存在手機上,當(dāng)未來有一天可以利用這些信息的時候,可以針對性的將很好的準確的結(jié)果推薦給你,例如在廣州的某一條街上搜索午餐,就會將附近的餐廳進行排序,例如知道你喜歡吃粵菜還是四川菜,就會長期的將你喜歡吃的菜排在前面,因此長期來看移動搜索是看好的。”類似的模式在實踐中還是有重大缺陷的――當(dāng)用戶需要使用手機進行工作性搜索時怎么辦?如果用戶使用Google的整合搜索在街道A想請女朋友在街道B吃一餐飯那豈不是要糟?但不管怎么說,這些創(chuàng)意,雖然不能說是成功地解決了目前所面臨的問題,但他至少能開拓人們的視野。
問題已然出現(xiàn),但解決方案又在哪里呢?未來的搜索引擎之路該如何走?解決問題的方向又在哪里呢?百度的創(chuàng)始人李彥宏認為,未來搜索引擎的發(fā)展方向是類似于“百度知道”,但事實將會是這樣的嗎?就本質(zhì)而言,雖然“百度知道”或許真的能解決一部分人想得到的結(jié)果,但他明顯超出了搜索引擎的概念,所謂搜索引擎,只是一種檢索的方式,而“百度知道”卻是在制造和提供內(nèi)容,所以,有理由認為用“百度知道”來解決搜索引擎所遇到的搜索精度嚴重不足的問題并不是一個好的主意。而Google認為,未來搜索引擎的發(fā)展方向是“人工智能”,顯然,似乎Google對搜索引擎的理解更接近正解,然而問題是現(xiàn)有的人工智能技術(shù)遠未成熟,在技術(shù)上無法提供Google想要實現(xiàn)這一目標的手段,如何才能實現(xiàn)人工智能?什么時候人類才能對計算機人工智能取得實質(zhì)上的突破呢?就在搜索引擎在電腦搜索領(lǐng)域里如何解決網(wǎng)資訊頁海量增長所面臨的問題還找不到北的時候,手機網(wǎng)絡(luò)時代的到來,對手機WEB搜索提出了實實在在的需求,這一情況,讓原來就沒準備好的搜索引擎促不及防,而這種情況,對用戶來說是一種不幸,但對于企業(yè)來說是一種大幸,一個建立在用戶不幸之中的大幸,誰能解決這些用戶的不幸,誰將成為3G時代最大的殺手。
轉(zhuǎn):http://tech.ddvip.com/2008-08/121827234052448.html