摘要: 大數(shù)據(jù)時(shí)代挑戰(zhàn)與機(jī)遇并存,正確處理好大數(shù)據(jù),絕對是符合行業(yè)、企業(yè)利益的。只有更好的發(fā)揮數(shù)據(jù)價(jià)值,才能在大數(shù)據(jù)時(shí)代更好、更快的提高行業(yè)和企業(yè)的競爭力,引領(lǐng)企業(yè)前行。那么,大數(shù)據(jù)的價(jià)值點(diǎn)究竟在哪里呢?
閱讀全文
posted @
2015-03-26 21:23 kenlee14 閱讀(4286) |
評論 (3) |
編輯 收藏
今年過年,去一位長輩家拜年,剛好碰見他在研究股票趨勢,閑聊之下,“大數(shù)據(jù)”,竟然也從他嘴里蹦出來。真是 duang的一聲,把我嚇了一跳。大數(shù)據(jù),真不再是只可遠(yuǎn)觀,高大上的主了。
大數(shù)據(jù)雖然不再飄在空中,但對大數(shù)據(jù)的爭論卻從未停過。
何為大數(shù)據(jù)?
大數(shù)據(jù)的概念,喧囂社會之上也有好幾年了。但具體什么是大數(shù)據(jù),行業(yè)里也是各說不一。大狹義上來講,大數(shù)據(jù)就是巨量數(shù)據(jù),極大量的數(shù)據(jù)。但究竟是“多大”,才叫大數(shù)據(jù)呢?也是未有一個(gè)統(tǒng)一的說法,一般來說,10T量級的數(shù)據(jù)量,就可以稱之為“大”數(shù)據(jù)了。而廣義上的大數(shù)據(jù),更多是指包括數(shù)據(jù)本身在內(nèi)的,一整套數(shù)據(jù)處理分析框架。縱觀眾多的何為大數(shù)據(jù),小K以為,研究機(jī)構(gòu)Gartner給的定義還是比較不錯(cuò)的,也是百度百科上采用的定義:“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量的、高速增長率和多樣化的信息資產(chǎn)。
這個(gè)定義還是比較好的,區(qū)分了純數(shù)據(jù)量論,也比較符合實(shí)際項(xiàng)目落地的情況。比如一個(gè)客戶終端偏好分析,如果在現(xiàn)有數(shù)據(jù)、分析模型上,已經(jīng)可以99%的機(jī)會準(zhǔn)確分析出來,那再增加大量的數(shù)據(jù)去分析,這是毫無意義的,可能由于噪音數(shù)據(jù)的增加,準(zhǔn)確率更低也是可能的,就不應(yīng)該歸入大數(shù)據(jù)的范疇,用大數(shù)據(jù)的方式去處理。目標(biāo)數(shù)據(jù)要重質(zhì),而不是單純的量。
大數(shù)據(jù)平臺化
大數(shù)據(jù)該怎么玩?這也是一個(gè)大家熱烈討論的領(lǐng)域。大數(shù)據(jù)的快速發(fā)展、落地生根,可能已經(jīng)超出了它的最初的含義,拓展了內(nèi)涵。在數(shù)據(jù)量不斷劇增,數(shù)據(jù)資產(chǎn)化的趨勢下,大數(shù)據(jù)平臺化已經(jīng)成為業(yè)內(nèi)比較流行的一種建設(shè)方式。大數(shù)據(jù)平臺重在數(shù)據(jù)的采集、存儲、處理,重在數(shù)據(jù)能力的提供上,給應(yīng)用建設(shè)提供數(shù)據(jù)支撐,而不是直接面對最終用戶。如下圖:
據(jù)平臺化.jpg)
大數(shù)據(jù)平臺解決了在以往技術(shù)框架內(nèi),面對大量數(shù)據(jù)時(shí)難以解決的數(shù)據(jù)采集、存儲、處理問題,并根據(jù)上層應(yīng)用需求,提供了數(shù)據(jù)能力服務(wù),支撐上層應(yīng)用開發(fā),滿足最終用戶的各類需求。
在此,或許有朋友要糾結(jié)于:大數(shù)據(jù)平臺用什么技術(shù)建設(shè)比較好呢?目前熱門的hadoop技術(shù)?后起之秀spark?還是沉穩(wěn)的MPP?諸如此類。有什么關(guān)系呢?技術(shù)是為業(yè)務(wù)服務(wù)的,技術(shù)也是優(yōu)劣并存的,考慮的因素不一樣,技術(shù)選型就不一樣,沒有最好的技術(shù),只有最合適的場景。也許,沒幾年之后,又是一片新技術(shù)的天下。
小結(jié)
根據(jù)IDC的研究,從2005年到2012年,全球的數(shù)據(jù)量翻了27番,約達(dá)到2.5ZB,其中僅有25%的數(shù)據(jù)是有用的,僅有3%的數(shù)據(jù)貼有標(biāo)簽?zāi)鼙皇褂?,僅有0.5%的數(shù)據(jù)被用于分析。大量的數(shù)據(jù)被閑置,被丟棄,價(jià)值被埋沒。隨著技術(shù)的不斷發(fā)展,數(shù)據(jù)價(jià)值的不斷體現(xiàn),大數(shù)據(jù)將會成為推動未來企業(yè)發(fā)展的重要引擎。BAT知道,全世界也知道。大數(shù)據(jù)之路,任重而道遠(yuǎn)。
posted @
2015-03-02 10:37 kenlee14 閱讀(191) |
評論 (0) |
編輯 收藏
摘要: 一篇又長又臭的文章,如果單純只有文字描述,而沒有插圖或分點(diǎn)敘述,顯然不可能吸引所有人閱讀。問題是,你確實(shí)需要所有讀者都去細(xì)讀這篇文章嗎?不。在大多數(shù)情況下,我們的目標(biāo)是,讓有興趣的人細(xì)讀,其他人掃描性地閱讀。如何做到?這篇文章結(jié)合Useit的研究報(bào)告以及我個(gè)人的寫博客經(jīng)驗(yàn),作出提高文章可讀性的總結(jié)。
閱讀全文
posted @
2008-07-13 23:01 kenlee14 閱讀(256) |
評論 (1) |
編輯 收藏
摘要: 星矢:動畫片《圣斗士星矢》的男豬腳,超級小強(qiáng),怎么打也打不死。
雅典娜:動畫片《圣斗士星矢》的女豬腳,自稱女神,手下有88個(gè)男人為他賣命。
狀態(tài)模式:為了方便的控制狀態(tài)的變化,避免一堆IF/ELSE,以及狀態(tài)規(guī)則改變的時(shí)避免代碼改動的混亂。
觀察者模式:一個(gè)被觀察者一動,多個(gè)觀察者跟著動,經(jīng)常用于界面UI。
閱讀全文
posted @
2008-07-09 14:54 kenlee14 閱讀(1627) |
評論 (10) |
編輯 收藏
內(nèi)容來源:http://lgn21st.javaeye.com/blog/212204
由于某些原因,SourceForge.net不能訪問了... :(
這里是臨時(shí)解決方案,來自Python郵件列表上的兄弟.
1. 用代理,通過這個(gè)地址訪問:
http://www.mirrorservice.org/sites/download.sourceforge.net/pub/sourceforge/c/cr/
2. 用FTP
ftp://ftp.jaist.ac.jp/pub/sourceforge/
ftp://sourceforge.nchc.org.tw/
posted @
2008-07-08 14:20 kenlee14 閱讀(262) |
評論 (0) |
編輯 收藏