IT之路在何方
<!--[if !supportLists]-->一. <!--[endif]-->摘要
James Gray于1998年獲得圖靈獎。在獲獎會上,他提出了未來信息技術要解決的著名的十二個問題,他給未來IT的發展指明了研究的方向,對計算機行業的發展具有重大意義,本文在介紹他所提出的十二問題的基礎上,結合自己對IT發展的認識,對其中的一些問題給出了自己的一些想法。
<!--[if !supportLists]-->二. <!--[endif]-->關鍵字 Jim Gray 十二問題 IT 發展方向 ,人工智能
<!--[if !supportLists]-->三. <!--[endif]-->背景知識介紹
Jim Gray 格雷畢業于伯克萊大學,先后供職于國際商用機器(IBM)公司、微軟舊金山研究所。他曾參與建設了世界最大的天文學數據庫SloanDigitalSky -Server,其中所研究的星系從最初的100萬達到了如今的2億個,他參與設計的“世界視野望遠鏡”把天文學家的數據庫連接為一個整體。如果沒有他,那么世界大概不會是今天的樣子,自動提款機、網上購物、甚至Google Earth的問世都要推遲。
格雷“開創性的數據庫研究”為自動提款機(ATM)、機票網上預定系統和Google Earth的誕生奠定了基礎,并在1998年獲得了計算機科學領域的最高獎項——圖靈獎。
圖靈獎主要授予在計算機技術領域做出突出貢獻的個人。而這些貢獻必須對計算機業有長遠而重要的影響。他在圖靈獎的獲獎會上做了題為“What Next? A Dozen Remaining Information Technology Problems”的演講。這12個研究目標并非完全是格雷的個人看法,它們代表了眾多計算機科學家和信息學家的意見,有很廣泛的代表性,非常值得我們重視。
四.提出的十二個問題
在James Gray的演講中,他提出了未來信息技術領域需要解決的12個長遠問題。
第一個問題是:可擴展性。設計出一種硬件和軟件體系結構能夠以百萬級的比例因子工作。
其目的就是設計出一種可以無限制的硬件和軟件體系結構,但限于資金和時間等因素,比較實際的做法是使同一個計算問題由一個節點擴展到百萬個節點也就是說,僅僅通過增加更多的資源,一個應用的存儲,處理能力能夠以百萬級的比例自動增長;同時處理作業的速度和規模同樣以百萬級的比例加快。
可擴展性問題將會衍生出大型計算機系統方方面面的問題,這種系統是依靠模塊依次遞加的,每個模塊承擔計算任務的一小部分,一個模塊失效了,任務應該能自動移植到其他的模塊上去并能繼續執行。自我管理,容錯性和負載均衡仍然是當前誠待解決的挑戰
第二個問題是,圖靈測試。構造一個計算機系統使它至少能有30%的時間贏得模仿游戲。
圖靈測試是基于一種三個人玩的模仿游戲,在游戲中,一個男人和女人在一個房間中,而裁判在另一個房間中。他們三個彼此看不到對方,因此通過電子郵件聯絡,裁判向他們問5分鐘的問題從而確定哪一個是男的哪一個是女的。這本來應該是很簡單的,除非這個男的撒謊,假裝自己是女的。而這個女的盡力幫助裁判弄清事實真相。如果這個男的很會演戲的話,他可能在一半的時間內愚弄裁判,事實上,這個裁判在70%的時間內是正確的
在過去的50余年里,計算機在圖靈測試方面已經取得巨大的進步,計算機已初步具有簡單的大腦存儲和計算能力。但其中,計算機還只是充當工具和合作者而非智能機器,所以,目前的超級計算機軟件和數據庫在下一個十年里也不會通過圖靈測試。這里需要一些與現在完全不同的想法。
第三個問題 語音文本。使計算機能夠聽懂并將語言轉化為文本。
第四個問題 文本語音。使計算機能夠說話并將文本轉化為語言。
第五個問題 同人類一樣的視覺,可以辨認物體和行為。
圖靈測試中兩個隱藏的子問題是,一是計算機要像人類一樣進行閱讀和理解,再就是能和人一樣思考可書寫。但二者都和圖靈測試一樣困難。
目前在計算機對自然語言,音樂等的鑒別有了很大的進步,演講到文本的轉化系統已經能要很好的利用了,當然這很大程度上要歸功于計算機硬件的發展,但他目前使用的算法仍得益于對自然語言的深層次的理解。其增長的速度很慢,而且詞庫也非常的有限。另一個問題是,跟定一個文本,計算機能否像人一樣對問題進行關注,這是進行人機交互的一種重要方式。基于上述問題的考慮,jim Gray 提出了上述三個問題
第六個問題 個人memex存儲器。能夠存儲一個人看到和聽到的一切東西,同時能夠快速找回任何請求的條目。
能記錄一個人一生的所見所聞一直我們夢寐以求的事情。但這仍然有很多難點,這其中既有技術上的難點也有社會學的問題。但不管怎么說,這是一個值得研究的方向。前景非常的寬闊。
第七個問題 世界memex存儲器。構建一個系統,通過給定一個文本集,可以像人類該領域的專家一樣回答關于文本的問題和對文本做出快速和準確的總結。
這其中的一個挑戰就是自動分析組織信息,一旦某個人有了問題,那么這個問題可以輸入到一個自然的接口里面去,這種結構融會了語言,姿勢 圖形和其他形式借口,這種系統能根據用戶的層次提供合適的答案。這是個需要解決的任務,也許能有人工智能來完成,但它是個一個非常棒的目標,也許比計算機能像人一樣的玩虛擬游戲更有意義。
第八個問題 遠程介入。讓觀察員在模擬以前發生的事件時,與當時在場的人員有同樣感覺(即遠程觀察);或者參與者模擬正在發生的事件時,能與其他人交流,就像親臨現場一樣(即遠程出席)。
把所有事情記錄下來之所以令人感興趣的原因之一,就是能使其他人立刻看到或以后回顧。我們大多數人都發現這種“時間轉移”要比“空間轉移”更有價值。通過多角度、高保真地記錄事件,計算機可以重現從任何角度觀察到的高保真圖像,讓觀察者有完全身臨其境的感受。這項技術的挑戰性在于記錄事件后按要求生成虛擬環境,允許觀察者像實際參與者那樣體驗事件,我們把這叫做“遠程介入”。 今天的電視與廣播已實現了這種方案的低質量版本,但它們完全是被動的。下一個挑戰就是允許遠程介入者與現場人員進行交流,即遠程出席。對于遠程出席,目前 已存在的形式有電話、遠程電話會議和聊天室。但是,這比親臨現場的體驗要差得多。因而,人們仍然愿意經過長途跋涉以得到更真實的體驗。對遠程出席的可操作 性測試之一,就是看遠程介入的學生和直接面對教師的學生的成績是否一樣好,教師與兩組學生的關系是否同樣和諧親切。
第九個問題 無差錯系統。構建一個每天可以被上百萬人使用的系統而只需要一個業余人員來管理和操作。
第十個問題 安全的系統。確保上面系統的服務只提供給授權者,未授權者無法得到服務。同時要能證明信息沒有被泄露。
第十一個問題 永不down機。確保系統在一百年的時間內至多只有一秒鐘不可用。
第十二個問題 自動編程。設計出一種特別的語言或用戶接口,它能夠(a)人們能夠非常容易地表達自己的設計思想,比現在容易1000倍;(b)計算機可以編譯;(c)能夠完整地描述所有的應用。這個系統因該能對應用進行推理,對異常和不完整的情況提出問題;但使用起來不應該很煩瑣。
這就是12個非常有趣的研究問題,每個問題都是一個長期研究的課題,這也是jim gray 向政府尋求長期資助的原因,據推測,50年后,計算機科學的發展會在每個問題的研究上都會有進步的。這些問題包括非常廣的種類:圖靈智能機提高了人機交互結構,布爾的存儲記錄,分析和總結所發生的任何事情。Babbage’s的計算機能自我變成,從不出錯因而是安全的 。當然這些問題在現在看來是有些不合實際,但根據摩爾定律:每十八個月技術的發展等于之前所有的發展總和,如果摩爾定律繼續有效的話,那么上述提出的問題就有可能會變成現實的。
五.小結
我們可以看出這12個問題都是信息技術領域的一些根本性的問題。其中有很多問題是與人工智能緊密結合的。這些問題的逐步解決就是整個信息技術和信息產業不斷進步和發展過程。對這些問題的研究和解決,需要長期的投資支持。在這個過程當中,我們能夠產生新的想法,同時能夠鍛煉和培養我們的學生,政府應該提供一些 資金支持。一些長期的研究項目可以包括,人機接口—使計算機能夠更加容易地與人交互;對信息的組織,總結和分析;
結合當前計算機行業發展的趨勢和Jim gray 的文章,我認為計算機智能技術將是一個熱點,尤其是與計算機網絡結合起來的智能技術將會得到前所未有的重視與發展.自然,智能技術中現在面臨的還未解決的問題將引起人們空前的關注。約翰·巴克斯把計算技術分為了四個大的發展階段,硬件、軟件、網絡和通訊、認知計算技術,他認為繼網絡和通訊之后的未來十年,認知計算技術將是下一步發展方向,即計算機能夠進行思想識別,就像人類用大腦思考一樣,這是智能技術的表現。
巴 特勒·蘭普森把計算機的應用分為三個大的階段,模擬仿真、通訊和存儲、具體化,認為計算機繼通訊和存儲之后的下一步應用是具體化,包括機器人、語音等應用范圍,他還詳細列舉了兩個例子來說明具體化,一是自主駕駛,二是自動編程,這兩個例子的共同點就是要讓計算機懂得或者明白一些事情,這是計算機智能化的體 現。
<!--[if !supportLists]-->六. <!--[endif]-->參考文獻
[1] Graph based on data in Hans P. Moravec Robot, Mere Machines to Transcendent Mind, Oxford, 1999, ISBN 0-19-511630-5, (http://www.frc.ri.cmu.edu/~hpm/book98/) personal communication with Larry Roberts who developed the metric in 1969, and personal communication with Gordon Bell who helped analyze the data and corrected some errors.
[2] Donald E. Stokes, Pasteur’s Quadrant: Basic Science and Technological Innovation, Brookings, 1997, ISBN 0-8157-8178-4.
[3] Jim Gray . What Next? A Dozen Information-Technology Research Goals. June 1999 Technical Report MS-TR-99-50