隨筆 - 6  文章 - 129  trackbacks - 0
          <2025年7月>
          293012345
          6789101112
          13141516171819
          20212223242526
          272829303112
          3456789

          常用鏈接

          留言簿(14)

          隨筆檔案(6)

          文章分類(467)

          文章檔案(423)

          相冊

          收藏夾(18)

          JAVA

          搜索

          •  

          積分與排名

          • 積分 - 829298
          • 排名 - 49

          最新評論

          閱讀排行榜

          評論排行榜

          原文地址:http://blog.51cto.com/jackwxh/1917673

          sqoop import --hive-import --hive-overwrite  --connect jdbc:oracle:thin:@192.168.92.136:1521:cyporcl --username ODS --password 'od154DS$!('  -m 1  --hive-database ODS --table Q_TRA_DISPUTESTATUS --fields-terminated-by '\001' --hive-drop-import-delims  --null-string '\\N' --null-non-string '\\N'  --map-column-java DISPUTERESULT=String

          DISPUTERESULT 這個字段是Oracleclob 類型的,里面有回車, 加載到hive 里面導致 記錄增多。


          --map-column-java和--map-column-hive兩個參數都要顯示給出;還需要設置--hive-drop-import-delims這樣才能順利導出數據。

          .導入的列有換行符如何解決
          本以為萬事大吉,萬萬沒想到導入的列有nclob類型,里面存儲了一篇篇文章,勢必有著換行符。果不其然,hive查詢數據全部錯亂, 查詢資料發現--hive-delims-replacement(替換/n,/r等符號用你指定的字符)和--hive-drop-import-delims參數。可添加上去發現并沒有什么卵用,沒有起作用。百度goole很久,終于發現一篇帖子,http://stackoverflow.com/questions/28076200/hive-drop-import-delims-not-removing-newline-while-using-hcatalog-in-sqoop
          意思是要用--map-column-java參數來顯示指定列為String類型。我的解決方案為 --map-column-java 我的CLOB列=String 果然,問題解決,換行符全部被去掉。不過聽說改變存儲格式 或許也可以避免這個問題,希望有著經驗的大神來回答一下。總結下來就這么多,希望能幫助大家



          posted on 2018-04-03 18:01 Ke 閱讀(2708) 評論(0)  編輯  收藏 所屬分類: hive
          主站蜘蛛池模板: 邵东县| 杭州市| 思南县| 邯郸县| 玉林市| 开化县| 化隆| 红河县| 三都| 中阳县| 启东市| 密山市| 新化县| 黄平县| 临洮县| 宁陵县| 荆州市| 长乐市| 南通市| 成安县| 普兰县| 田东县| 克什克腾旗| 石棉县| 十堰市| 墨江| 德安县| 麟游县| 宝应县| 水城县| 富阳市| 綦江县| 长海县| 越西县| 永吉县| 普格县| 永平县| 峨山| 灵寿县| 旌德县| 宿州市|