摘要: Pig是一個(gè)基于Hadoop的大規(guī)模數(shù)據(jù)分析平臺(tái)對(duì)高級(jí)過程語言,適合于使用 Hadoop 和 MapReduce 平臺(tái)來查詢大型半結(jié)構(gòu)化數(shù)據(jù)集。通過允許對(duì)分布式數(shù)據(jù)集進(jìn)行類似 SQL 的查詢,該語言的編譯器會(huì)把類SQL的數(shù)據(jù)分析請(qǐng)求轉(zhuǎn)換為一系列經(jīng)過優(yōu)化處理的MapReduce運(yùn)算,Pig 可以簡(jiǎn)化 Hadoop 的使用。 閱讀全文
posted @ 2014-06-04 22:14 tangtb 閱讀(5912) | 評(píng)論 (0) 編輯 |