隨筆-14  評論-25  文章-1  trackbacks-0

          from http://www.code365.com/web/122/Article/17927.Asp


          Thomas Bayes,一位偉大的數(shù)學大師,他的理論照亮了今天的計算領域,和他的同事們不同:他認為上帝的存在可以通過方程式證明,他最重要的作品被別人發(fā)行,而他已經(jīng)去世241年了。

          18世紀牧師們關于概率的理論成為應用發(fā)展的數(shù)學基礎的一部分。

          搜索巨人Google和Autonomy,一家出售信息恢復工具的公司,都使用了貝葉斯定理(Bayesian principles)為數(shù)據(jù)搜索提供近似的(但是技術上不確切)結果。研究人員還使用貝葉斯模型來判斷癥狀和疾病之間的相互關系,創(chuàng)建個人機器人,開發(fā) 能夠根據(jù)數(shù)據(jù)和經(jīng)驗來決定行動的人工智能設備。

          雖然聽起來很深奧,而這個原理的意思--大致說起來--卻很簡單:某件事情發(fā)生的概率大致可以由它過去發(fā)生的頻率近似地估計出來。研究人員把這個原理應用在每件事上,從基因研究到過濾電子郵件。

          在明尼蘇達州大學的網(wǎng)站上能夠找到一份詳細的數(shù)學概要。而在Gametheory.net上的一個Bayes Rule Applet程序讓你能夠回答諸如“如果你測試某種疾病,有多大風險”之類的問題。

          貝葉斯理論的一個出名的倡導者就是微軟。該公司把概率用于它的Notification Platform。該技術將會被內置到微軟未來的軟件中,而且讓計算機和蜂窩電話能夠自動地過濾信息,不需要用戶幫助,自動計劃會議并且和其他人聯(lián)系。

          如果成功的話,該技術將會導致“context server”--一種電子管家的出現(xiàn),它能夠解釋人的日常生活習慣并在不斷變換的環(huán)境中組織他們的生活。

          “Bayes的研究被用于決定我應該怎樣最好地分配計算和帶寬,” Eric Horvitz表示,他是微軟研究部門Adaptive Systems & Interaction Group的高級研究員和分組管理者。“我個人相信在這個不確定的世界里,你不能夠知道每件事,而概率論是任何智能的基礎。”

          到今年年底,Intel也將發(fā)布它自己的基于貝葉斯理論的工具包。一個關于照相機的實驗警告醫(yī)生說病人可能很快遭受痛苦。在本周晚些時候在該公司的Developer Forum(開發(fā)者論壇)上將討論這種發(fā)展。

          雖然它在今天很流行,Bayes的理論并不是一直被廣泛接受的:就在10年前,Bayes研究人員還在他們的專業(yè)上躊躇不前。但是其后,改進的數(shù)學模型,更快的計算機和實驗的有效結果增加了這種學派新的可信程度。

          “問題之一是它被過度宣傳了,” Intel微處理器實驗室的應用軟件和技術管理經(jīng)理Omid Moghadam表示。“事實上,能夠處理任何事情的能力并不存在。真正的執(zhí)行在過去的10年里就發(fā)生了。”

          Bayes啞元
          Bayes的理論可以粗略地被簡述成一條原則:為了預見未來,必須要看看過去。Bayes的理論表示未來某件事情發(fā)生的概率可以通過計算它過去發(fā)生的頻率來估計。一個彈起的硬幣正面朝上的概率是多少?實驗數(shù)據(jù)表明這個值是50%。

          “Bayes表示從本質上說,每件事都有不確定性,你有不同的概率類型,”斯坦佛的管理科學和工程系(Department of Management Science and Engineering at Stanford)的教授Ron Howard表示。

          例如,假設不是硬幣,一名研究人員把塑料圖釘往上拋,想要看看它釘頭朝上落地的概率有多大,或者有多少可能性是側面著地,而釘子是指向什么方向的。形狀,成型過程中的誤差,重量分布和其他的因素都會影響該結果。

          Bayes技術的吸引力在于它的簡單性。預測完全取決于收集到的數(shù)據(jù)--獲得的數(shù)據(jù)越多,結果就越好。另一個優(yōu)點在于Bayes模型能夠自我糾正,也就是說數(shù)據(jù)變化了,結果也就跟著變化。

          概率論的思想改變了人們和計算機互動的方式。“這種想法是計算機能夠更象一個幫助者而不僅僅是一個終端設備,” Peter Norvig表示。他是Google的安全質量總監(jiān)。他說“你在尋找的是一些指導,而不是一個標準答案。”

          從這種轉變中,研究獲益非淺。幾年前,所謂的Boolean搜索引擎的一般使用需要把搜索按照“if, and, or but”的語法進行提交,然后去尋找匹配的詞。現(xiàn)在的搜索引擎采用了復雜的運算法則來搜索數(shù)據(jù)庫,并找出可能的匹配。

          如同圖釘?shù)哪莻€例子顯示的那樣,復雜性和對于更多數(shù)據(jù)的需要可能很快增長。由于功能強大的計算機的出現(xiàn),對于把好的猜測轉變成近似的輸出所必須的結果進行控制成為可能。

          更重要的是,UCLA的Judea Pearl這樣的研究人員研究出如何讓Bayes模型能夠更好地追蹤不同的現(xiàn)象之間條件關系的方法,這樣能夠極大地減少計算量。

          例如,對于人口進行大規(guī)模的關于肺癌成因的調查可能會發(fā)現(xiàn)它是一種不太廣泛的疾病,但是如果局限在吸煙者范圍內進行調查就可能會發(fā)現(xiàn)一些關聯(lián)性。對于肺癌患者進行檢查能夠幫助調查清楚習慣和這種疾病之間的關系。

          “每一個單獨的屬性或者征兆都可能取決于很多不同的事情,但是直接決定它的卻是為數(shù)不多的事情,”斯坦佛計算機科學系(computer science department at Stanford)的助理教授Daphne Koller表示。“在過去的15年左右的時間里,人們在工具方面進行了改革,這讓你能夠描繪出大量人群的情況。”

          和其他一些項目一樣,Koller是使用概率論技術來更好地把病癥和疾病聯(lián)系起來,并把遺傳基因和特定的細胞現(xiàn)象聯(lián)系起來。

          記錄演講
          一項相關的技術,名為Hidden Markov模型,讓概率能夠預測次序。例如,一個演講識別應用知道經(jīng)常在“q”之后的字母是“u”。除了這些,該軟件還能夠計算“Qagga”(一種滅絕了的斑馬的名稱)一詞出現(xiàn)的概率。

          概率技術已經(jīng)內置在微軟的產(chǎn)品中了。Outlook Mobile Manage是一個能夠決定什么時候往移動設備上發(fā)出一封內勤的電子郵的軟件。它是從Priorities發(fā)展而來的,Priorities是微軟在 1998年公布的一個實驗系統(tǒng)。Windows XP的故障檢修引擎也依賴于概率計算。

          隨著該公司的Notification Platform開始內置在產(chǎn)品中,在未來的一年中會有更多的應用軟件發(fā)布,微軟的Horvitz這樣表示。

          Notification Platform的一個重要組成部分名為Coordinate,它從個人日歷,鍵盤,傳感器照相機以及其他來源收集數(shù)據(jù),來了解某個人生活和習慣。收集的 數(shù)據(jù)可能包括到達的時間,工作時間和午餐的時間長度,哪種類型的電話或電子郵件被保存,而哪些信息被刪除,在某天的特定時間里鍵盤被使用的頻率,等等。

          這些數(shù)據(jù)可以被用來管理信息流和使用者收到的其他信息。例如,如果一位經(jīng)理在下午2:40發(fā)送了一封電子郵件給一名員工, Coordinate可以檢查該員工的日歷程序,然后發(fā)現(xiàn)他在下午2:00有一個會議。該程序還可以掃描關于該員工習慣的數(shù)據(jù),然后發(fā)現(xiàn)該員工通常會在有 會議之后大約一個小時才重新使用鍵盤。該程序可能還能夠發(fā)現(xiàn)該名員工通常會在5分鐘之內回復該經(jīng)理的電子郵件。根據(jù)上面這些數(shù)據(jù),該軟件能夠估計出該員工 可能至少在20分鐘之內不可能回復該電子郵件,該軟件可能會把這條信息發(fā)送到該員工的手提電話上。同時,該軟件可能會決定不把別人的電子郵件也轉發(fā)出去。

          “我們正在平衡以打攪你為代價所獲得信息的價值,” Horvitz表示。使用這個軟件,他堅持道,“能夠讓更多的人跟上事情的發(fā)展,而不被大量的信息所淹沒。”

          Horvitz補充道,隱私和對于這些功能的用戶控制是確定的。呼叫者并不知道為什么一條信息可能會被優(yōu)先或推遲處理。

          微軟還把Bayes模型使用在其他的一些產(chǎn)品上,包括DeepListener 以及Quartet (語音激活),SmartOOF 以及TimeWave (聯(lián)系控制)。消費者多媒體軟件也獲益非淺,Horvitz表示。

          Bayes技術不僅僅被應用在PC領域。在University of Rochester,研究人員發(fā)現(xiàn)一個人的步伐可以在一步前發(fā)生改變。雖然這種改變對于人類來說太過于細微,一臺和電腦連接在一起的照相機可以捕捉并跟蹤 這種動作。如果行走異常出現(xiàn),計算機就能夠發(fā)出警報。

          一個實驗用的安全照相機采用了同樣的原理:大部分到達機場的人都會在停車以后直接走向目的地,所以如果有人停了車,然后走向另一輛車就不太正常,因此就可能引發(fā)警報。今年秋天一個創(chuàng)建Bayes模型和技術信息的基本引擎將會公布在Intel的開發(fā)者網(wǎng)站上。

          理論沖突
          雖然該技術聽起來簡單易懂,關于它的計算可能卻比較慢。Horvitz回憶說他是斯坦佛20世紀80年代僅有的兩個概率和人工智能的畢業(yè)生之一。其他所有的人學習的是邏輯系統(tǒng),采用的是“if and then”的模式和世界互動。

          “概率論那時候不流行,” Horvitz表示。但是當邏輯系統(tǒng)不能夠預測所有的意外情況時,潮流發(fā)生了轉變。

          很多研究人員開始承認人類的決策過程比原來想象的要神秘的多。“在人工智能領域存在著文化偏見,” Koller表示。“人們現(xiàn)在承認他們并不知道他們的腦子是如何工作的。”

          即便在他的時代,Bayes發(fā)現(xiàn)他自己置身于主流之外。他于1702年出生于倫敦,后來他成為了一名Presbyterian minister。雖然他看到了自己的兩篇論文被發(fā)表了,他的理論很有效,但是《Essay Toward Solving a Problem in the Doctrine of Chances》卻一直到他死后的第三年,也就是1764年才被發(fā)表。

          他的王室成員身份一直是個謎,直到最近幾年,新發(fā)現(xiàn)的一些信件表明他私下和英格蘭其他一些思想家看法一致。

          “就我所知,他從來沒有寫下貝葉斯定理,” Howard表示。

          神學家Richard Price和法國的數(shù)學家Pierre Simon LaPlace成為了早期的支持者。該理論和后來George Boole,布爾數(shù)學之父,的理論背道而馳。George Boole的理論是基于代數(shù)邏輯的,并最終導致了二進制系統(tǒng)的誕生。也是皇室成員之一的Boole死于1864年。

          雖然概率的重要性不容置疑,可是關于它的應用的爭論卻沒有停止過。批評者周期性地聲稱Bayes模型依賴于主觀的數(shù)據(jù),而讓人類去判斷答案是否正確。而概率論模型沒有完全解決在人類思維過程中存在的細微差別的問題。

          “兒童如何學習現(xiàn)在還不是很清楚,”IBM研究部門的科學和軟件副總裁 Alfred Spector這樣表示。他計劃把統(tǒng)計學方法和邏輯系統(tǒng)在他的Combination Hypothesis之中結合起來。“我最初相信是統(tǒng)計學的范疇,但是從某方面說,你將會發(fā)現(xiàn)不僅僅是統(tǒng)計學的問題。”

          但是,很有可能概率論是基礎。

          “這是個基礎,” Horvitz表示。“它被忽略了一段時間,但是它是推理的基礎。”

          posted on 2006-05-30 12:51 混沌中立 閱讀(436) 評論(0)  編輯  收藏 所屬分類: 非技術
          主站蜘蛛池模板: 特克斯县| 常宁市| 丹棱县| 郓城县| 石狮市| 寻甸| 博爱县| 靖西县| 刚察县| 井研县| 恩施市| 漠河县| 高阳县| 昌都县| 通山县| 鹰潭市| 乌兰察布市| 东城区| 宝兴县| 宁国市| 富平县| 盖州市| 开江县| 漾濞| 余姚市| 白朗县| 芜湖市| 渑池县| 永登县| 出国| 江阴市| 洞口县| 水城县| 甘洛县| 威信县| 英德市| SHOW| 米泉市| 田林县| 竹山县| 凤阳县|