paulwong

          PIG小議

          什么是PIG
          是一種設(shè)計(jì)語(yǔ)言,通過(guò)設(shè)計(jì)數(shù)據(jù)怎么流動(dòng),然后由相應(yīng)的引擎將此變成MAPREDUCE JOB去HADOOP中運(yùn)行。
          PIG與SQL
          兩者有相同之處,執(zhí)行一個(gè)或多個(gè)語(yǔ)句,然后出來(lái)一些結(jié)果。
          但不同的是,SQL要先把數(shù)據(jù)導(dǎo)到表中才能執(zhí)行,SQL不關(guān)心中間如何做,即發(fā)一個(gè)SQL語(yǔ)句過(guò)去,就有結(jié)果出來(lái)。
          PIG,無(wú)須導(dǎo)數(shù)據(jù)到表中,但要設(shè)計(jì)直到出結(jié)果的中間過(guò)程,步驟如何等等。

          posted on 2013-04-05 21:33 paulwong 閱讀(359) 評(píng)論(0)  編輯  收藏 所屬分類: 分布式HADOOP 、云計(jì)算 、PIG

          主站蜘蛛池模板: 漠河县| 本溪| 禄丰县| 昌邑市| 洛浦县| 化州市| 潍坊市| 益阳市| 巴林右旗| 汝南县| 株洲县| 襄汾县| 信丰县| 庆安县| 虹口区| 团风县| 汉川市| 新乡县| 茂名市| 启东市| 固安县| 特克斯县| 涡阳县| 台东县| 噶尔县| 沂南县| 禹城市| 图木舒克市| 乌什县| 监利县| 塔城市| 阿拉尔市| 商城县| 聂荣县| 静安区| 龙口市| 台山市| 华宁县| 泾川县| 临夏市| 基隆市|