alexcai
我的JAVA實踐 https://github.com/igool

隨筆-35 評論-33 文章-0 trackbacks-0

HDFS和MapReduce是Hadoop的兩大核心，除此之外Hbase、Hive這兩個核心工具也隨著Hadoop發(fā)展變得越來越重要。今天我們只初步的看看HDFS.

HDFS的體系架構(gòu)

整個Hadoop的體系結(jié)構(gòu)主要是通過HDFS來實現(xiàn)對分布式存儲的底層支持，并通過MR來實現(xiàn)對分布式并行任務(wù)處理的程序支持。

圖中涉及三個角色：NameNode、DataNode、Client。NameNode是管理者，DataNode是文件存儲者、Client是需要獲取分布式文件系統(tǒng)的應用程序。

作為JAVA開發(fā)者來說，spring 絕對是我們的最大福因。大家一定要看一下這里，hadoop 套餐。里面有對hdfs,mapreduce,hive,hbase的訪問封裝，個人覺得秉承了spring一貫的簡單實用風格，一定要贊一下。

下面，我們結(jié)合實際的例子闡述一下使用方法：

配置地址：

hadoop數(shù)據(jù)源初始化：

hdfs數(shù)據(jù)存儲對象定義

文件對象寫入

數(shù)據(jù)查詢與過濾

最關(guān)鍵就是查詢，你可以RefinableView的條件組合，搜尋你所要的數(shù)據(jù)。

語法理解：

with:等于

from:大于等于

fromafter:大于

to:小于等于

tobefore:小于

小樣:demo

我的微信公眾號，歡迎溝通學習。

posted on 2017-07-24 10:35 alexcai 閱讀(667) 評論(0) 編輯收藏

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導航: 博客園 IT新聞 Chat2DB C++博客博問管理

<

2017年7月

>

日

一

二

三

四

五

六

25

26

27

28

29

30

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

HDFS的體系架構(gòu)

常用鏈接

留言簿(2)

隨筆檔案

搜索

最新評論

閱讀排行榜

評論排行榜