paulwong

          HIVE資源

          Hive是建立在Hadoop上的數(shù)據(jù)倉庫基礎(chǔ)構(gòu)架。它提供了一系列的工具,可以用來進(jìn)行數(shù)據(jù)提取轉(zhuǎn)化加載(ETL),這是一種可以存儲(chǔ)、查詢和分析存儲(chǔ)在 Hadoop 中的大規(guī)模數(shù)據(jù)的機(jī)制。Hive 定義了簡單的類 SQL 查詢語言,稱為 HQL,它允許熟悉 SQL 的用戶查詢數(shù)據(jù)。同時(shí),這個(gè)語言也允許熟悉 MapReduce 開發(fā)者的開發(fā)自定義的 mapper 和 reducer 來處理內(nèi)建的 mapper 和 reducer 無法完成的復(fù)雜的分析工作。


          Hive 沒有專門的數(shù)據(jù)格式。 Hive 可以很好的工作在 Thrift 之上,控制分隔符,也允許用戶指定數(shù)據(jù)格式


          hive與關(guān)系數(shù)據(jù)庫的區(qū)別:

          數(shù)據(jù)存儲(chǔ)不同:hive基于hadoop的HDFS,關(guān)系數(shù)據(jù)庫則基于本地文件系統(tǒng)

          計(jì)算模型不同:hive基于hadoop的mapreduce,關(guān)系數(shù)據(jù)庫則基于索引的內(nèi)存計(jì)算模型

          應(yīng)用場景不同:hive是OLAP數(shù)據(jù)倉庫系統(tǒng)提供海量數(shù)據(jù)查詢的,實(shí)時(shí)性很差;關(guān)系數(shù)據(jù)庫是OLTP事務(wù)系統(tǒng),為實(shí)時(shí)查詢業(yè)務(wù)服務(wù)

          擴(kuò)展性不同:hive基于hadoop很容易通過分布式增加存儲(chǔ)能力和計(jì)算能力,關(guān)系數(shù)據(jù)庫水平擴(kuò)展很難,要不斷增加單機(jī)的性能


          Hive安裝及使用攻略
          http://blog.fens.me/hadoop-hive-intro/


          R利劍NoSQL系列文章 之 Hive
          http://cos.name/2013/07/r-nosql-hive/








          posted on 2013-09-01 12:41 paulwong 閱讀(420) 評(píng)論(0)  編輯  收藏 所屬分類: 云計(jì)算HIVE

          主站蜘蛛池模板: 澄城县| 靖边县| 饶平县| 中西区| 根河市| 金秀| 神农架林区| 周宁县| 宁陵县| 徐闻县| 卢龙县| 松潘县| 饶阳县| 灌云县| 凤凰县| 墨竹工卡县| 沂源县| 惠来县| 毕节市| 泸水县| 遵化市| 黔东| 乐清市| 无为县| 清流县| 游戏| 安塞县| 蒙山县| 土默特左旗| 兰西县| 申扎县| 镇平县| 兴隆县| 英超| 永清县| 永新县| 积石山| 醴陵市| 留坝县| 喀喇| 桂东县|