PIG小議
什么是PIG
是一種設計語言,通過設計數據怎么流動,然后由相應的引擎將此變成MAPREDUCE JOB去HADOOP中運行。
PIG與SQL
兩者有相同之處,執行一個或多個語句,然后出來一些結果。
但不同的是,SQL要先把數據導到表中才能執行,SQL不關心中間如何做,即發一個SQL語句過去,就有結果出來。
PIG,無須導數據到表中,但要設計直到出結果的中間過程,步驟如何等等。
posted on 2013-04-05 21:33 paulwong 閱讀(359) 評論(0) 編輯 收藏 所屬分類: 分布式 、HADOOP 、云計算 、PIG