posts - 5,comments - 14,trackbacks - 0
          <2008年7月>
          293012345
          6789101112
          13141516171819
          20212223242526
          272829303112
          3456789

          常用鏈接

          留言簿(1)

          隨筆檔案

          文章檔案

          搜索

          •  

          最新評論

          閱讀排行榜

          評論排行榜

               摘要: 大數(shù)據(jù)時(shí)代挑戰(zhàn)與機(jī)遇并存,正確處理好大數(shù)據(jù),絕對是符合行業(yè)、企業(yè)利益的。只有更好的發(fā)揮數(shù)據(jù)價(jià)值,才能在大數(shù)據(jù)時(shí)代更好、更快的提高行業(yè)和企業(yè)的競爭力,引領(lǐng)企業(yè)前行。那么,大數(shù)據(jù)的價(jià)值點(diǎn)究竟在哪里呢?  閱讀全文
          posted @ 2015-03-26 21:23 kenlee14 閱讀(4286) | 評論 (3)編輯 收藏

          今年過年,去一位長輩家拜年,剛好碰見他在研究股票趨勢,閑聊之下,“大數(shù)據(jù)”,竟然也從他嘴里蹦出來。真是 duang的一聲,把我嚇了一跳。大數(shù)據(jù),真不再是只可遠(yuǎn)觀,高大上的主了。

          大數(shù)據(jù)雖然不再飄在空中,但對大數(shù)據(jù)的爭論卻從未停過。

          何為大數(shù)據(jù)?

          大數(shù)據(jù)的概念,喧囂社會之上也有好幾年了。但具體什么是大數(shù)據(jù),行業(yè)里也是各說不一。大狹義上來講,大數(shù)據(jù)就是巨量數(shù)據(jù),極大量的數(shù)據(jù)。但究竟是“多大”,才叫大數(shù)據(jù)呢?也是未有一個(gè)統(tǒng)一的說法,一般來說,10T量級的數(shù)據(jù)量,就可以稱之為“大”數(shù)據(jù)了。而廣義上的大數(shù)據(jù),更多是指包括數(shù)據(jù)本身在內(nèi)的,一整套數(shù)據(jù)處理分析框架。縱觀眾多的何為大數(shù)據(jù),小K以為,研究機(jī)構(gòu)Gartner給的定義還是比較不錯(cuò)的,也是百度百科上采用的定義:“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量的、高速增長率和多樣化的信息資產(chǎn)。

          這個(gè)定義還是比較好的,區(qū)分了純數(shù)據(jù)量論,也比較符合實(shí)際項(xiàng)目落地的情況。比如一個(gè)客戶終端偏好分析,如果在現(xiàn)有數(shù)據(jù)、分析模型上,已經(jīng)可以99%的機(jī)會準(zhǔn)確分析出來,那再增加大量的數(shù)據(jù)去分析,這是毫無意義的,可能由于噪音數(shù)據(jù)的增加,準(zhǔn)確率更低也是可能的,就不應(yīng)該歸入大數(shù)據(jù)的范疇,用大數(shù)據(jù)的方式去處理。目標(biāo)數(shù)據(jù)要重質(zhì),而不是單純的量。

          大數(shù)據(jù)平臺化

             大數(shù)據(jù)該怎么玩?這也是一個(gè)大家熱烈討論的領(lǐng)域。大數(shù)據(jù)的快速發(fā)展、落地生根,可能已經(jīng)超出了它的最初的含義,拓展了內(nèi)涵。在數(shù)據(jù)量不斷劇增,數(shù)據(jù)資產(chǎn)化的趨勢下,大數(shù)據(jù)平臺化已經(jīng)成為業(yè)內(nèi)比較流行的一種建設(shè)方式。大數(shù)據(jù)平臺重在數(shù)據(jù)的采集、存儲、處理,重在數(shù)據(jù)能力的提供上,給應(yīng)用建設(shè)提供數(shù)據(jù)支撐,而不是直接面對最終用戶。如下圖:

          大數(shù)據(jù)平臺解決了在以往技術(shù)框架內(nèi),面對大量數(shù)據(jù)時(shí)難以解決的數(shù)據(jù)采集、存儲、處理問題,并根據(jù)上層應(yīng)用需求,提供了數(shù)據(jù)能力服務(wù),支撐上層應(yīng)用開發(fā),滿足最終用戶的各類需求。

          在此,或許有朋友要糾結(jié)于:大數(shù)據(jù)平臺用什么技術(shù)建設(shè)比較好呢?目前熱門的hadoop技術(shù)?后起之秀spark?還是沉穩(wěn)的MPP?諸如此類。有什么關(guān)系呢?技術(shù)是為業(yè)務(wù)服務(wù)的,技術(shù)也是優(yōu)劣并存的,考慮的因素不一樣,技術(shù)選型就不一樣,沒有最好的技術(shù),只有最合適的場景。也許,沒幾年之后,又是一片新技術(shù)的天下。

          小結(jié)

          根據(jù)IDC的研究,從2005年到2012年,全球的數(shù)據(jù)量翻了27番,約達(dá)到2.5ZB,其中僅有25%的數(shù)據(jù)是有用的,僅有3%的數(shù)據(jù)貼有標(biāo)簽?zāi)鼙皇褂?,僅有0.5%的數(shù)據(jù)被用于分析。大量的數(shù)據(jù)被閑置,被丟棄,價(jià)值被埋沒。隨著技術(shù)的不斷發(fā)展,數(shù)據(jù)價(jià)值的不斷體現(xiàn),大數(shù)據(jù)將會成為推動未來企業(yè)發(fā)展的重要引擎。BAT知道,全世界也知道。大數(shù)據(jù)之路,任重而道遠(yuǎn)。

          posted @ 2015-03-02 10:37 kenlee14 閱讀(191) | 評論 (0)編輯 收藏
               摘要: 一篇又長又臭的文章,如果單純只有文字描述,而沒有插圖或分點(diǎn)敘述,顯然不可能吸引所有人閱讀。問題是,你確實(shí)需要所有讀者都去細(xì)讀這篇文章嗎?不。在大多數(shù)情況下,我們的目標(biāo)是,讓有興趣的人細(xì)讀,其他人掃描性地閱讀。如何做到?這篇文章結(jié)合Useit的研究報(bào)告以及我個(gè)人的寫博客經(jīng)驗(yàn),作出提高文章可讀性的總結(jié)。  閱讀全文
          posted @ 2008-07-13 23:01 kenlee14 閱讀(256) | 評論 (1)編輯 收藏
               摘要: 星矢:動畫片《圣斗士星矢》的男豬腳,超級小強(qiáng),怎么打也打不死。
          雅典娜:動畫片《圣斗士星矢》的女豬腳,自稱女神,手下有88個(gè)男人為他賣命。
          狀態(tài)模式:為了方便的控制狀態(tài)的變化,避免一堆IF/ELSE,以及狀態(tài)規(guī)則改變的時(shí)避免代碼改動的混亂。
          觀察者模式:一個(gè)被觀察者一動,多個(gè)觀察者跟著動,經(jīng)常用于界面UI。  閱讀全文
          posted @ 2008-07-09 14:54 kenlee14 閱讀(1627) | 評論 (10)編輯 收藏
          內(nèi)容來源:http://lgn21st.javaeye.com/blog/212204
          由于某些原因,SourceForge.net不能訪問了... :(

          這里是臨時(shí)解決方案,來自Python郵件列表上的兄弟.

          1. 用代理,通過這個(gè)地址訪問:
          http://www.mirrorservice.org/sites/download.sourceforge.net/pub/sourceforge/c/cr/

          2. 用FTP
          ftp://ftp.jaist.ac.jp/pub/sourceforge/
          ftp://sourceforge.nchc.org.tw/
          posted @ 2008-07-08 14:20 kenlee14 閱讀(262) | 評論 (0)編輯 收藏
          主站蜘蛛池模板: 西宁市| 姚安县| 手游| 莱州市| 山西省| 和顺县| 江门市| 桓仁| 界首市| 綦江县| 隆回县| 加查县| 大理市| 达孜县| 芦山县| 旺苍县| 唐河县| 那曲县| 耒阳市| 绵阳市| 永安市| 佛坪县| 和平县| 朔州市| 泽库县| 滕州市| 山东| 仁寿县| 灵寿县| 中方县| 黄大仙区| 桃江县| 榆林市| 阳泉市| 大悟县| 宁远县| 和田县| 哈巴河县| 内丘县| 济阳县| 利川市|