paulwong

          HIVE資源

          Hive是建立在Hadoop上的數據倉庫基礎構架。它提供了一系列的工具,可以用來進行數據提取轉化加載(ETL),這是一種可以存儲、查詢和分析存儲在 Hadoop 中的大規模數據的機制。Hive 定義了簡單的類 SQL 查詢語言,稱為 HQL,它允許熟悉 SQL 的用戶查詢數據。同時,這個語言也允許熟悉 MapReduce 開發者的開發自定義的 mapper 和 reducer 來處理內建的 mapper 和 reducer 無法完成的復雜的分析工作。


          Hive 沒有專門的數據格式。 Hive 可以很好的工作在 Thrift 之上,控制分隔符,也允許用戶指定數據格式


          hive與關系數據庫的區別:

          數據存儲不同:hive基于hadoop的HDFS,關系數據庫則基于本地文件系統

          計算模型不同:hive基于hadoop的mapreduce,關系數據庫則基于索引的內存計算模型

          應用場景不同:hive是OLAP數據倉庫系統提供海量數據查詢的,實時性很差;關系數據庫是OLTP事務系統,為實時查詢業務服務

          擴展性不同:hive基于hadoop很容易通過分布式增加存儲能力和計算能力,關系數據庫水平擴展很難,要不斷增加單機的性能


          Hive安裝及使用攻略
          http://blog.fens.me/hadoop-hive-intro/


          R利劍NoSQL系列文章 之 Hive
          http://cos.name/2013/07/r-nosql-hive/








          posted on 2013-09-01 12:41 paulwong 閱讀(417) 評論(0)  編輯  收藏 所屬分類: 云計算HIVE

          主站蜘蛛池模板: 太仆寺旗| 江源县| 通海县| 大英县| 石林| 介休市| 凤冈县| 清流县| 清远市| 郯城县| 封开县| 尼勒克县| 云阳县| 华阴市| 七台河市| 沅陵县| 瑞丽市| 定边县| 大邑县| 琼海市| 元谋县| 青神县| 沐川县| 洛宁县| 桐乡市| 娱乐| 蓬安县| 全南县| 黄龙县| 济源市| 桃园市| 微山县| 松桃| 楚雄市| 康保县| 青阳县| 仁寿县| 克拉玛依市| 安丘市| 若尔盖县| 邯郸县|