Gridking
過深巷,駐門廊,天公欲斷腸,為瑣事黯然神傷。 眼過窗,還流浪,曲終須更張,任瞼婆娑卻彷徨。 看牛郎,獨(dú)惆悵,一碗孟婆湯,與緣商榷將情忘! 枉思量,兩茫茫,半盞曳星光,三杯咖啡未曾糖! |
1.引言
Internet/Web技術(shù)的快速普及和迅猛發(fā)展,使各種信息可以以非常低的成本在網(wǎng)絡(luò)上獲得,正是鑒于這種,現(xiàn)在的用戶面臨著信息過載的問題[86],現(xiàn)在的信息用戶在與web交互時(shí)存在著如下的問題:
(a.) 發(fā)現(xiàn)相關(guān)信息。當(dāng)用戶想在web上查找特定信息而使用搜索服務(wù)時(shí),他會(huì)發(fā)現(xiàn)查詢的結(jié)果大部分是不相關(guān)的東西。當(dāng)前的搜索存在著第準(zhǔn)確度和低召回率等問題[20]。(b) 在可用的web信息的基礎(chǔ)上生成知識(shí)。這可以看作是上個(gè)問題的子問題,一些研究[34,85,29] 側(cè)重于把web用作決策的知識(shí)庫(kù)。(c.) 信息顯示的個(gè)性化。(d.) 個(gè)性化用戶的學(xué)習(xí)。這實(shí)際上是上一個(gè)問題的特定子問題。
而 web 挖掘則能直接或間接的解決上述問題。Web挖掘指使用數(shù)據(jù)挖掘技術(shù)在WWW數(shù)據(jù)中發(fā)現(xiàn)潛在的、有用的模式或信息。Web挖掘研究覆蓋了多個(gè)研究領(lǐng)域,包括數(shù)據(jù)庫(kù)技術(shù)、信息獲取技術(shù)、統(tǒng)計(jì)學(xué)、人工智能中的機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等。
2.歷史發(fā)展
Web mining,這個(gè)術(shù)語是Oren Etzioni,[1]于1996年正式提出來的,這個(gè)概念提出來以后,很多研究人員在他們的文章用它來指代不同的含義, Jaideep Srivastava[2]和他的同事的定義為:web 挖掘是利用數(shù)據(jù)挖掘的技術(shù)從web 文檔或服務(wù)上自動(dòng)的發(fā)現(xiàn)和抽取信息。根據(jù)Etzioni[41] ,web 挖掘可以分解為四個(gè)子任務(wù):
a. 查找資源:任務(wù)是從目標(biāo)Web文檔中得到數(shù)據(jù),值得注意的是有時(shí)信息資源不僅限于在線Web文檔,還包括電子郵件、電子文檔、新聞組,或者網(wǎng)站的日志數(shù)據(jù)甚至是通過Web形成的交易數(shù)據(jù)庫(kù)中的數(shù)據(jù)。
b.信息選擇和預(yù)處理:任務(wù)是從取得的Web資源中剔除無用信息和將信息進(jìn)行必要的整理。例如從Web文檔中自動(dòng)去除廣告連接、去除多余格式標(biāo)記、自動(dòng)識(shí)別段落或者字段并將數(shù)據(jù)組織成規(guī)整的邏輯形式甚至是關(guān)系表。
c.歸類:在同一個(gè)站點(diǎn)內(nèi)部或在多個(gè)站點(diǎn)之間進(jìn)行自動(dòng)進(jìn)行通用模式發(fā)現(xiàn)。
d.模式分析:驗(yàn)證、解釋上一步驟產(chǎn)生的模式。可以是機(jī)器自動(dòng)完成,也可以是與分析人員進(jìn)行交互來完成。
Web 挖掘涉及到 從web數(shù)據(jù) 發(fā)現(xiàn)潛在的有用的或沒用的信息或知識(shí)的所有過程,它隱含的實(shí)現(xiàn)了數(shù)據(jù)知識(shí)發(fā)現(xiàn)的標(biāo)準(zhǔn)處理過程(KDD)[43],可以看作是KDD在web數(shù)據(jù)上的應(yīng)用擴(kuò)展。目前,研究人員將web挖掘分為三個(gè)大類[2,3]:
a. web 內(nèi)容挖掘。它應(yīng)用數(shù)據(jù)挖掘的技術(shù)來挖掘發(fā)布在因特網(wǎng)上資源的內(nèi)容,通常是html文件(半結(jié)構(gòu)化的),無格式文本和xml文檔(結(jié)構(gòu)化的)。
b.web 結(jié)構(gòu)挖掘依靠web的超鏈接結(jié)構(gòu)。這種圖形結(jié)構(gòu)可以提供關(guān)于page rank的信息[4]或權(quán)威性[5] ,通過過濾能提高搜索的結(jié)果。
c. web用法挖掘 分析用戶和web服務(wù)器的互操作結(jié)果,包括 web日志,點(diǎn)擊流和數(shù)據(jù)庫(kù)事務(wù)等。Web用法挖掘涉及到了隱私的問題現(xiàn)在引起了不少的爭(zhēng)論。
Fabrizio Sebastini[6]和Soumen Chakrabarti[7] 詳細(xì)的探討了web 內(nèi)容挖掘的技術(shù) Furnkranz 則對(duì)web結(jié)構(gòu)挖掘進(jìn)行了總結(jié)工作
3.現(xiàn)狀評(píng)述
Web內(nèi)容挖掘和結(jié)構(gòu)挖掘中,工作多集中在如下:
把web看作是一個(gè)數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)領(lǐng)域的早期研究工作集中在web的層次觀點(diǎn),在半結(jié)構(gòu)化的web上層置一層包含某些相關(guān)語義信息的抽象層,weblog[10]和webSql[11]正是這種基于數(shù)據(jù)庫(kù)的方法,在這個(gè)領(lǐng)域,最近大部分的工作重點(diǎn)在實(shí)現(xiàn)語義web。
文檔分類同樣是當(dāng)前一個(gè)研究的熱點(diǎn)問題,早期的文檔分類工作是把文本挖掘技術(shù)直接到web數(shù)據(jù)上,但是后期的研究工作表明:充分利用web的圖形結(jié)構(gòu)或以html為表現(xiàn)形式的半結(jié)構(gòu)化內(nèi)容,有助于提高分類的結(jié)果[14],Google新聞(http://new.google.com)便是從當(dāng)前的新聞信息中自動(dòng)的聚合分類的.
網(wǎng)頁(yè)權(quán)重問題。Larry Page和他的同事提出了pagerank[4],并通過google的搜尋引擎的成功運(yùn)用推廣流行,利用pagerank 爬蟲能提前計(jì)算出網(wǎng)頁(yè)的排序,并將其結(jié)果返回,網(wǎng)頁(yè)的pagerank的計(jì)算是基于該網(wǎng)頁(yè)對(duì)其他網(wǎng)頁(yè)的鏈接度。Sepandar Kamwar[14]對(duì)基本的pagerank算法進(jìn)行了改進(jìn),對(duì)計(jì)算量代價(jià)有明顯的提高。但這種基本的方法并沒有考慮到鏈接的語義。聰明的做法就是利用網(wǎng)頁(yè)的內(nèi)容來進(jìn)行評(píng)定。對(duì)那些與查詢相似的鏈接給與更高的權(quán)重。Soumen Chakrabarti正是基于這種考慮提出了改進(jìn)的算法[14]。實(shí)驗(yàn)結(jié)果表明,這種改進(jìn)比同等方法相比,效果有明顯提高。
Web用法挖掘在電子商務(wù)有許多的應(yīng)用,包括:個(gè)性化,交通分析和針對(duì)性廣告等。圖形化分析工具如webviz[15]的發(fā)展使得web事務(wù)的挖掘流行起來。這個(gè)領(lǐng)域中的主要工作是web日志數(shù)據(jù)的預(yù)處理和從處理的數(shù)據(jù)中發(fā)現(xiàn)有用模式[16,17]。Etzioni[19]將web用法挖掘用在飛機(jī)票的購(gòu)買應(yīng)用上。其方法是根據(jù)時(shí)間挖掘出網(wǎng)上可用的飛機(jī)票價(jià)格以此來推薦用戶在最合適的時(shí)間來購(gòu)票。Web用法挖掘還涉及到個(gè)人的隱私問題,不再敘述。
當(dāng)前一個(gè)一個(gè)比較新的課題是語義web 挖掘,在語義網(wǎng)中,向web資源中添加語義,是通過添加基于本體的注解來實(shí)現(xiàn)的,但不能寄希望于人工手動(dòng)完成,因?yàn)檫@雖然簡(jiǎn)單但卻不不能擴(kuò)展。因此我們必須通過本體學(xué)習(xí),匹配,歸并和實(shí)例學(xué)習(xí)來自動(dòng)實(shí)現(xiàn)注解。語義網(wǎng)和web 挖掘相互促進(jìn),web 挖掘能促進(jìn)語義網(wǎng)的出現(xiàn),而語義網(wǎng)則使得web 挖掘的效率更高。 4.發(fā)展前景預(yù)測(cè)
根據(jù)目前的研究狀況預(yù)測(cè),今后幾年Web 挖掘研究的主要方向可能會(huì)有:
1) 在數(shù)據(jù)預(yù)處理方面,多種Web 數(shù)據(jù)的收集、結(jié)構(gòu)轉(zhuǎn)換等處理技術(shù)的研究 ;
2) Web 挖掘方法和模式識(shí)別技術(shù)在構(gòu)造自適應(yīng)站點(diǎn)以及智能站點(diǎn)服務(wù)的個(gè)性化和性能優(yōu)化方面的研究;
3) Web 知識(shí)庫(kù)的動(dòng)態(tài)維護(hù)、更新,各種知識(shí)和模式的評(píng)價(jià)綜合方法的研究;
4) 基于Web 挖掘和信息檢索的,高效的、具有自動(dòng)導(dǎo)航功能的智能搜索引擎相關(guān)技術(shù)的研究;
5) 半結(jié)構(gòu)、結(jié)構(gòu)的文本數(shù)據(jù)、圖形圖像數(shù)據(jù)、多媒體數(shù)據(jù)的高效挖掘算法;
6) 研究專門用于知識(shí)發(fā)現(xiàn)的數(shù)據(jù)挖掘語言及其標(biāo)準(zhǔn)化;
7) 研究和開發(fā)基于Web 的多層數(shù)據(jù)體系結(jié)構(gòu)和智能集成系統(tǒng),提供相應(yīng)的查詢語言,優(yōu)化和維護(hù)機(jī)制;
8) 現(xiàn)有的數(shù)據(jù)挖掘方法與技術(shù)的改進(jìn)及其向Web 數(shù)據(jù)的擴(kuò)展,挖掘算法的適應(yīng)性和時(shí)效性的研究;
9) Web 文檔內(nèi)的模式發(fā)現(xiàn)及其在信息提取、文本分析中的應(yīng)用研究等;
10) Web 挖掘的相關(guān)技術(shù)在電子商務(wù)領(lǐng)域的應(yīng)用研究等 。
5.小結(jié)
不難看出 web 挖掘牽扯到太多的諸如信息檢索 信息抽取 數(shù)據(jù)挖掘 人工智能等技術(shù),現(xiàn)在的掌握的技術(shù)和時(shí)間來看,從其中的某一個(gè)點(diǎn)選則突破比較好。我比較傾向于web數(shù)據(jù)的收集工作。.................
網(wǎng)頁(yè)的自動(dòng)聚合分類,向網(wǎng)頁(yè)自動(dòng)添加標(biāo)注使其體現(xiàn)語義的特征,都可以作為研究方向進(jìn)行下去。
6.參考文獻(xiàn)
IT之路在何方
<!--[if !supportLists]-->一. <!--[endif]-->摘要
James Gray于1998年獲得圖靈獎(jiǎng)。在獲獎(jiǎng)會(huì)上,他提出了未來信息技術(shù)要解決的著名的十二個(gè)問題,他給未來IT的發(fā)展指明了研究的方向,對(duì)計(jì)算機(jī)行業(yè)的發(fā)展具有重大意義,本文在介紹他所提出的十二問題的基礎(chǔ)上,結(jié)合自己對(duì)IT發(fā)展的認(rèn)識(shí),對(duì)其中的一些問題給出了自己的一些想法。
<!--[if !supportLists]-->二. <!--[endif]-->關(guān)鍵字 Jim Gray 十二問題 IT 發(fā)展方向 ,人工智能
<!--[if !supportLists]-->三. <!--[endif]-->背景知識(shí)介紹
Jim Gray 格雷畢業(yè)于伯克萊大學(xué),先后供職于國(guó)際商用機(jī)器(IBM)公司、微軟舊金山研究所。他曾參與建設(shè)了世界最大的天文學(xué)數(shù)據(jù)庫(kù)SloanDigitalSky -Server,其中所研究的星系從最初的100萬達(dá)到了如今的2億個(gè),他參與設(shè)計(jì)的“世界視野望遠(yuǎn)鏡”把天文學(xué)家的數(shù)據(jù)庫(kù)連接為一個(gè)整體。如果沒有他,那么世界大概不會(huì)是今天的樣子,自動(dòng)提款機(jī)、網(wǎng)上購(gòu)物、甚至Google Earth的問世都要推遲。
格雷“開創(chuàng)性的數(shù)據(jù)庫(kù)研究”為自動(dòng)提款機(jī)(ATM)、機(jī)票網(wǎng)上預(yù)定系統(tǒng)和Google Earth的誕生奠定了基礎(chǔ),并在1998年獲得了計(jì)算機(jī)科學(xué)領(lǐng)域的最高獎(jiǎng)項(xiàng)——圖靈獎(jiǎng)。
圖靈獎(jiǎng)主要授予在計(jì)算機(jī)技術(shù)領(lǐng)域做出突出貢獻(xiàn)的個(gè)人。而這些貢獻(xiàn)必須對(duì)計(jì)算機(jī)業(yè)有長(zhǎng)遠(yuǎn)而重要的影響。他在圖靈獎(jiǎng)的獲獎(jiǎng)會(huì)上做了題為“What Next? A Dozen Remaining Information Technology Problems”的演講。這12個(gè)研究目標(biāo)并非完全是格雷的個(gè)人看法,它們代表了眾多計(jì)算機(jī)科學(xué)家和信息學(xué)家的意見,有很廣泛的代表性,非常值得我們重視。
四.提出的十二個(gè)問題
在James Gray的演講中,他提出了未來信息技術(shù)領(lǐng)域需要解決的12個(gè)長(zhǎng)遠(yuǎn)問題。
第一個(gè)問題是:可擴(kuò)展性。設(shè)計(jì)出一種硬件和軟件體系結(jié)構(gòu)能夠以百萬級(jí)的比例因子工作。
其目的就是設(shè)計(jì)出一種可以無限制的硬件和軟件體系結(jié)構(gòu),但限于資金和時(shí)間等因素,比較實(shí)際的做法是使同一個(gè)計(jì)算問題由一個(gè)節(jié)點(diǎn)擴(kuò)展到百萬個(gè)節(jié)點(diǎn)也就是說,僅僅通過增加更多的資源,一個(gè)應(yīng)用的存儲(chǔ),處理能力能夠以百萬級(jí)的比例自動(dòng)增長(zhǎng);同時(shí)處理作業(yè)的速度和規(guī)模同樣以百萬級(jí)的比例加快。
可擴(kuò)展性問題將會(huì)衍生出大型計(jì)算機(jī)系統(tǒng)方方面面的問題,這種系統(tǒng)是依靠模塊依次遞加的,每個(gè)模塊承擔(dān)計(jì)算任務(wù)的一小部分,一個(gè)模塊失效了,任務(wù)應(yīng)該能自動(dòng)移植到其他的模塊上去并能繼續(xù)執(zhí)行。自我管理,容錯(cuò)性和負(fù)載均衡仍然是當(dāng)前誠(chéng)待解決的挑戰(zhàn)
第二個(gè)問題是,圖靈測(cè)試。構(gòu)造一個(gè)計(jì)算機(jī)系統(tǒng)使它至少能有30%的時(shí)間贏得模仿游戲。
圖靈測(cè)試是基于一種三個(gè)人玩的模仿游戲,在游戲中,一個(gè)男人和女人在一個(gè)房間中,而裁判在另一個(gè)房間中。他們?nèi)齻€(gè)彼此看不到對(duì)方,因此通過電子郵件聯(lián)絡(luò),裁判向他們問5分鐘的問題從而確定哪一個(gè)是男的哪一個(gè)是女的。這本來應(yīng)該是很簡(jiǎn)單的,除非這個(gè)男的撒謊,假裝自己是女的。而這個(gè)女的盡力幫助裁判弄清事實(shí)真相。如果這個(gè)男的很會(huì)演戲的話,他可能在一半的時(shí)間內(nèi)愚弄裁判,事實(shí)上,這個(gè)裁判在70%的時(shí)間內(nèi)是正確的
在過去的50余年里,計(jì)算機(jī)在圖靈測(cè)試方面已經(jīng)取得巨大的進(jìn)步,計(jì)算機(jī)已初步具有簡(jiǎn)單的大腦存儲(chǔ)和計(jì)算能力。但其中,計(jì)算機(jī)還只是充當(dāng)工具和合作者而非智能機(jī)器,所以,目前的超級(jí)計(jì)算機(jī)軟件和數(shù)據(jù)庫(kù)在下一個(gè)十年里也不會(huì)通過圖靈測(cè)試。這里需要一些與現(xiàn)在完全不同的想法。
第三個(gè)問題 語音文本。使計(jì)算機(jī)能夠聽懂并將語言轉(zhuǎn)化為文本。
第四個(gè)問題 文本語音。使計(jì)算機(jī)能夠說話并將文本轉(zhuǎn)化為語言。
第五個(gè)問題 同人類一樣的視覺,可以辨認(rèn)物體和行為。
圖靈測(cè)試中兩個(gè)隱藏的子問題是,一是計(jì)算機(jī)要像人類一樣進(jìn)行閱讀和理解,再就是能和人一樣思考可書寫。但二者都和圖靈測(cè)試一樣困難。
目前在計(jì)算機(jī)對(duì)自然語言,音樂等的鑒別有了很大的進(jìn)步,演講到文本的轉(zhuǎn)化系統(tǒng)已經(jīng)能要很好的利用了,當(dāng)然這很大程度上要?dú)w功于計(jì)算機(jī)硬件的發(fā)展,但他目前使用的算法仍得益于對(duì)自然語言的深層次的理解。其增長(zhǎng)的速度很慢,而且詞庫(kù)也非常的有限。另一個(gè)問題是,跟定一個(gè)文本,計(jì)算機(jī)能否像人一樣對(duì)問題進(jìn)行關(guān)注,這是進(jìn)行人機(jī)交互的一種重要方式。基于上述問題的考慮,jim Gray 提出了上述三個(gè)問題
第六個(gè)問題 個(gè)人memex存儲(chǔ)器。能夠存儲(chǔ)一個(gè)人看到和聽到的一切東西,同時(shí)能夠快速找回任何請(qǐng)求的條目。
能記錄一個(gè)人一生的所見所聞一直我們夢(mèng)寐以求的事情。但這仍然有很多難點(diǎn),這其中既有技術(shù)上的難點(diǎn)也有社會(huì)學(xué)的問題。但不管怎么說,這是一個(gè)值得研究的方向。前景非常的寬闊。
第七個(gè)問題 世界memex存儲(chǔ)器。構(gòu)建一個(gè)系統(tǒng),通過給定一個(gè)文本集,可以像人類該領(lǐng)域的專家一樣回答關(guān)于文本的問題和對(duì)文本做出快速和準(zhǔn)確的總結(jié)。
這其中的一個(gè)挑戰(zhàn)就是自動(dòng)分析組織信息,一旦某個(gè)人有了問題,那么這個(gè)問題可以輸入到一個(gè)自然的接口里面去,這種結(jié)構(gòu)融會(huì)了語言,姿勢(shì) 圖形和其他形式借口,這種系統(tǒng)能根據(jù)用戶的層次提供合適的答案。這是個(gè)需要解決的任務(wù),也許能有人工智能來完成,但它是個(gè)一個(gè)非常棒的目標(biāo),也許比計(jì)算機(jī)能像人一樣的玩虛擬游戲更有意義。
第八個(gè)問題 遠(yuǎn)程介入。讓觀察員在模擬以前發(fā)生的事件時(shí),與當(dāng)時(shí)在場(chǎng)的人員有同樣感覺(即遠(yuǎn)程觀察);或者參與者模擬正在發(fā)生的事件時(shí),能與其他人交流,就像親臨現(xiàn)場(chǎng)一樣(即遠(yuǎn)程出席)。
把所有事情記錄下來之所以令人感興趣的原因之一,就是能使其他人立刻看到或以后回顧。我們大多數(shù)人都發(fā)現(xiàn)這種“時(shí)間轉(zhuǎn)移”要比“空間轉(zhuǎn)移”更有價(jià)值。通過多角度、高保真地記錄事件,計(jì)算機(jī)可以重現(xiàn)從任何角度觀察到的高保真圖像,讓觀察者有完全身臨其境的感受。這項(xiàng)技術(shù)的挑戰(zhàn)性在于記錄事件后按要求生成虛擬環(huán)境,允許觀察者像實(shí)際參與者那樣體驗(yàn)事件,我們把這叫做“遠(yuǎn)程介入”。 今天的電視與廣播已實(shí)現(xiàn)了這種方案的低質(zhì)量版本,但它們完全是被動(dòng)的。下一個(gè)挑戰(zhàn)就是允許遠(yuǎn)程介入者與現(xiàn)場(chǎng)人員進(jìn)行交流,即遠(yuǎn)程出席。對(duì)于遠(yuǎn)程出席,目前 已存在的形式有電話、遠(yuǎn)程電話會(huì)議和聊天室。但是,這比親臨現(xiàn)場(chǎng)的體驗(yàn)要差得多。因而,人們?nèi)匀辉敢饨?jīng)過長(zhǎng)途跋涉以得到更真實(shí)的體驗(yàn)。對(duì)遠(yuǎn)程出席的可操作 性測(cè)試之一,就是看遠(yuǎn)程介入的學(xué)生和直接面對(duì)教師的學(xué)生的成績(jī)是否一樣好,教師與兩組學(xué)生的關(guān)系是否同樣和諧親切。
第九個(gè)問題 無差錯(cuò)系統(tǒng)。構(gòu)建一個(gè)每天可以被上百萬人使用的系統(tǒng)而只需要一個(gè)業(yè)余人員來管理和操作。
第十個(gè)問題 安全的系統(tǒng)。確保上面系統(tǒng)的服務(wù)只提供給授權(quán)者,未授權(quán)者無法得到服務(wù)。同時(shí)要能證明信息沒有被泄露。
第十一個(gè)問題 永不down機(jī)。確保系統(tǒng)在一百年的時(shí)間內(nèi)至多只有一秒鐘不可用。
第十二個(gè)問題 自動(dòng)編程。設(shè)計(jì)出一種特別的語言或用戶接口,它能夠(a)人們能夠非常容易地表達(dá)自己的設(shè)計(jì)思想,比現(xiàn)在容易1000倍;(b)計(jì)算機(jī)可以編譯;(c)能夠完整地描述所有的應(yīng)用。這個(gè)系統(tǒng)因該能對(duì)應(yīng)用進(jìn)行推理,對(duì)異常和不完整的情況提出問題;但使用起來不應(yīng)該很煩瑣。
這就是12個(gè)非常有趣的研究問題,每個(gè)問題都是一個(gè)長(zhǎng)期研究的課題,這也是jim gray 向政府尋求長(zhǎng)期資助的原因,據(jù)推測(cè),50年后,計(jì)算機(jī)科學(xué)的發(fā)展會(huì)在每個(gè)問題的研究上都會(huì)有進(jìn)步的。這些問題包括非常廣的種類:圖靈智能機(jī)提高了人機(jī)交互結(jié)構(gòu),布爾的存儲(chǔ)記錄,分析和總結(jié)所發(fā)生的任何事情。Babbage’s的計(jì)算機(jī)能自我變成,從不出錯(cuò)因而是安全的 。當(dāng)然這些問題在現(xiàn)在看來是有些不合實(shí)際,但根據(jù)摩爾定律:每十八個(gè)月技術(shù)的發(fā)展等于之前所有的發(fā)展總和,如果摩爾定律繼續(xù)有效的話,那么上述提出的問題就有可能會(huì)變成現(xiàn)實(shí)的。
五.小結(jié)
我們可以看出這12個(gè)問題都是信息技術(shù)領(lǐng)域的一些根本性的問題。其中有很多問題是與人工智能緊密結(jié)合的。這些問題的逐步解決就是整個(gè)信息技術(shù)和信息產(chǎn)業(yè)不斷進(jìn)步和發(fā)展過程。對(duì)這些問題的研究和解決,需要長(zhǎng)期的投資支持。在這個(gè)過程當(dāng)中,我們能夠產(chǎn)生新的想法,同時(shí)能夠鍛煉和培養(yǎng)我們的學(xué)生,政府應(yīng)該提供一些 資金支持。一些長(zhǎng)期的研究項(xiàng)目可以包括,人機(jī)接口—使計(jì)算機(jī)能夠更加容易地與人交互;對(duì)信息的組織,總結(jié)和分析;
結(jié)合當(dāng)前計(jì)算機(jī)行業(yè)發(fā)展的趨勢(shì)和Jim gray 的文章,我認(rèn)為計(jì)算機(jī)智能技術(shù)將是一個(gè)熱點(diǎn),尤其是與計(jì)算機(jī)網(wǎng)絡(luò)結(jié)合起來的智能技術(shù)將會(huì)得到前所未有的重視與發(fā)展.自然,智能技術(shù)中現(xiàn)在面臨的還未解決的問題將引起人們空前的關(guān)注。約翰·巴克斯把計(jì)算技術(shù)分為了四個(gè)大的發(fā)展階段,硬件、軟件、網(wǎng)絡(luò)和通訊、認(rèn)知計(jì)算技術(shù),他認(rèn)為繼網(wǎng)絡(luò)和通訊之后的未來十年,認(rèn)知計(jì)算技術(shù)將是下一步發(fā)展方向,即計(jì)算機(jī)能夠進(jìn)行思想識(shí)別,就像人類用大腦思考一樣,這是智能技術(shù)的表現(xiàn)。
巴 特勒·蘭普森把計(jì)算機(jī)的應(yīng)用分為三個(gè)大的階段,模擬仿真、通訊和存儲(chǔ)、具體化,認(rèn)為計(jì)算機(jī)繼通訊和存儲(chǔ)之后的下一步應(yīng)用是具體化,包括機(jī)器人、語音等應(yīng)用范圍,他還詳細(xì)列舉了兩個(gè)例子來說明具體化,一是自主駕駛,二是自動(dòng)編程,這兩個(gè)例子的共同點(diǎn)就是要讓計(jì)算機(jī)懂得或者明白一些事情,這是計(jì)算機(jī)智能化的體 現(xiàn)。
<!--[if !supportLists]-->六. <!--[endif]-->參考文獻(xiàn)
[1] Graph based on data in Hans P. Moravec Robot, Mere Machines to Transcendent Mind, Oxford, 1999, ISBN 0-19-511630-5, (http://www.frc.ri.cmu.edu/~hpm/book98/) personal communication with Larry Roberts who developed the metric in 1969, and personal communication with Gordon Bell who helped analyze the data and corrected some errors.
[2] Donald E. Stokes, Pasteur’s Quadrant: Basic Science and Technological Innovation, Brookings, 1997, ISBN 0-8157-8178-4.
[3] Jim Gray . What Next? A Dozen Information-Technology Research Goals. June 1999 Technical Report MS-TR-99-50
研究生是個(gè)特殊的群體,在外人看來,我們像是管在象牙塔,肯定幸福得不得了,但事實(shí)并非如此,我們總是存在這樣或那樣的問題,其中比較值得關(guān)注的就是:研究生在人際交往上還存在比較多的困擾。
這其中有其客觀原因的存在,一方面大家都來自不同的大學(xué),四年的大學(xué)經(jīng)歷造就了大家不同的學(xué)習(xí)生活的習(xí)慣和思考問題的方式,看待問題的觀點(diǎn),這些分歧的存在從某種程度上影響了大家彼此的交往。再大家的年齡跨度比較大,有二十出頭的年青人,也有三十多歲成家立業(yè)者,年齡的差距,往往使大家人際交往中的代溝。年輕人總喜歡比較新潮的東西,而年齡大的喜好則與他們的不同。同樣,有些人是參加工作后來讀的研,而有些人則是直接從大學(xué)當(dāng)中升上來的,缺少一定上社會(huì)經(jīng)歷,這種閱歷的差異,使德我們看待問題的方式和觀點(diǎn),關(guān)注問題的側(cè)重點(diǎn)或多或少的有所差別。而這些差別從某種程度上會(huì)妨礙我們的人際交往。
拋開這些客觀原因不講,在人際交往中,我們研究生自身也有好多問題。研究生太過于關(guān)注自身的發(fā)展和自我娛樂。特別是像我們工科的研究生,把一些學(xué)習(xí)工作的方式帶到了我們的生活中。很多問題喜好自己埋頭苦搞,很多時(shí)候只顧低頭走路,不愿抬頭看天。不會(huì)或很少放一放主動(dòng)和別人交流一下自己的心得和一些想法。做學(xué)問,獨(dú)立鉆研思考是對(duì)的,但把這種方式帶到生活中來,不跟別人進(jìn)行必要的聯(lián)系溝通,這會(huì)給別人造成一種難以接近的久而久之會(huì)被孤立的。特別是我們80年代后的這一批人,大部分人是獨(dú)生子女,好多人從小在家里養(yǎng)尊處優(yōu),心理上保持著一些優(yōu)越感,再加上較強(qiáng)的渴望成功的心態(tài),使得我們更關(guān)注自身的發(fā)展,而較少顧及到他人,這無疑會(huì)影響我們的交際。
過多的自我關(guān)注,使我們研究生在交往中待人接物往往不夠坦誠(chéng),仁厚和友善。而且不大愿意關(guān)心他人。研究生這個(gè)層次,人的心理都已基本成熟,每個(gè)人都有自己獨(dú)特的生活方式,不再像中學(xué)生那么可以輕易嘻嘻哈哈打成一片。從本科上到研究生的轉(zhuǎn)變,大家逐步培養(yǎng)自己的一個(gè)事業(yè)的概念,其做事的目的會(huì)更明確。同時(shí)壓力也自然接踵而至,實(shí)驗(yàn)室的項(xiàng)目的進(jìn)展,自己的開題,論文,無時(shí)無刻不壓著我們;需要考慮的問題也更多,從近的論文畢業(yè),到今后社會(huì)立足、成家立業(yè)等等大多數(shù)人都在每天忙著自己的事情。很多人因?yàn)榭床坏矫魈旎蚴遣辉笇?duì)現(xiàn)實(shí)而感到苦不堪言,更多人選擇了沉默。都快一年多了,除了自己實(shí)驗(yàn)室的一些人,本班的同學(xué)都沒認(rèn)全。。大家就處在實(shí)驗(yàn)室這個(gè)小圈子內(nèi),很少與陌生人打交道,與人打交道的能力也分廠匱乏。久而久之,就形成惡性循環(huán)。
當(dāng)然這并不是我們內(nèi)心不喜歡與人交往,在前不久進(jìn)行的一次心里輔導(dǎo)課上,在大家發(fā)言的環(huán)節(jié)上,同學(xué)們提的最多的就是要?jiǎng)?chuàng)造一個(gè)讓大家在一起彼此認(rèn)識(shí),溝通的機(jī)會(huì)。這說明我們研究生除了需要必需的邏輯思維能力和創(chuàng)造力外,我們還需要其他同學(xué)的關(guān)心和友情,寬容和幫助。我們也希望與身邊的每個(gè)同學(xué)無話不談,希望有很多很多的朋友。我們可以向他們分享自己的快樂,也可以宣泄自己的不平、憤怒、委屈和煩惱,可以排解心中的苦悶。我們也很愿意向別人打開自己的世界。
那么,在研究生階段,如何建立一個(gè)適合而良好的人際關(guān)系呢?我認(rèn)為這固然有外在環(huán)境等因素,但更多的是內(nèi)在自身的因素。我們要提高人際交往的能力就要發(fā)現(xiàn)自身存在的問題,只有發(fā)現(xiàn)了自身的不足,才能解決問題。首先要正視自我,悅納自我,要與人為善,以寬容的態(tài)度對(duì)待他人。其次對(duì)人要誠(chéng)懇真切,再者,有有顆開放的心,當(dāng)自己遇到困難時(shí),要找到正確的途徑和合適的人尋求幫助,注意留心周圍的朋友的,在他們有困難時(shí),伸出自己的雙手 。只有這樣,才能提高人際交往的能力,使自己能夠全面發(fā)展,自我的價(jià)值也就更大!