sqoop import --hive-import --hive-overwrite --connect jdbc:oracle:thin:@192.168.92.136:1521:cyporcl --username ODS --password 'od154DS$!(' -m 1 --hive-database ODS --table Q_TRA_DISPUTESTATUS --fields-terminated-by '\001' --hive-drop-import-delims --null-string '\\N' --null-non-string '\\N' --map-column-java DISPUTERESULT=String
DISPUTERESULT 這個字段是Oracleclob 類型的,里面有回車, 加載到hive 里面導致 記錄增多。
--map-column-java和--map-column-hive兩個參數都要顯示給出;還需要設置--hive-drop-import-delims這樣才能順利導出數據。
.導入的列有換行符如何解決
本以為萬事大吉,萬萬沒想到導入的列有nclob類型,里面存儲了一篇篇文章,勢必有著換行符。果不其然,hive查詢數據全部錯亂, 查詢資料發現--hive-delims-replacement(替換/n,/r等符號用你指定的字符)和--hive-drop-import-delims參數。可添加上去發現并沒有什么卵用,沒有起作用。百度goole很久,終于發現一篇帖子,http://stackoverflow.com/questions/28076200/hive-drop-import-delims-not-removing-newline-while-using-hcatalog-in-sqoop
意思是要用--map-column-java參數來顯示指定列為String類型。我的解決方案為 --map-column-java 我的CLOB列=String 果然,問題解決,換行符全部被去掉。不過聽說改變存儲格式 或許也可以避免這個問題,希望有著經驗的大神來回答一下。總結下來就這么多,希望能幫助大家