Change Dir

          先知cd——熱愛生活是一切藝術的開始

          統計

          留言簿(18)

          積分與排名

          “牛”們的博客

          各個公司技術

          我的鏈接

          淘寶技術

          閱讀排行榜

          評論排行榜

          Hive配置項的含義詳解(4)

          hive.exec.drop.ignorenoneexistent:在drop表或者視圖時如果發現表或視圖不存在,是否報錯,默認是true;

          hive.exec.show.job.failure.debug.info:在作業失敗時是否提供一個任務debug信息,默認true;

          hive.auto.progress.timeout:運行自動progressor的時間間隔,默認是0等價于forever;

          hive.table.parameters.default:新建表的屬性字段默認值,默認是empty空;

          hive.variable.substitute:是否支持變量替換,如果開啟的話,支持語法如${var} ${system:var}和${env.var},默認是true;

          hive.error.on.empty.partition:在遇到結果為空的動態分區時是否報錯,默認是false;

          hive.exim.uri.scheme.whitelist:在導入導出數據時提供的一個白名單列表,列表項之間由逗號分隔,默認hdfs,pfile;

          hive.limit.row.max.size:字面意思理解就是在使用limit做數據的子集查詢時保證的最小行數據量,默認是100000;

          hive.limit.optimize.limit.file:使用簡單limit查詢數據子集時,可抽樣的最大文件數,默認是10;

          hive.limit.optimize.enable:使用簡單limit抽樣數據時是否開啟優化選項,默認是false,關于limit的優化問題,在hive programming書中解釋的是這個feature有drawback,對于抽樣的不確定性給出了風險提示;

          hive.limit.optimize.fetch.max:使用簡單limit抽樣數據允許的最大行數,默認50000,查詢query受限,insert不受影響;

          hive.rework.mapredwork:是否重做mapreduce,默認是false;

          hive.sample.seednumber:用來區分抽樣的數字,默認是0;

          hive.io.exception.handlers:io異常處理handler類列表,默認是空,當record reader發生io異常時,由這些handler來處理異常;

          hive.autogen.columnalias.prefix.label:當在執行中自動產生列別名的前綴,當類似count這樣的聚合函數起作用時,如果不明確指出count(a) as xxx的話,那么默認會從列的位置的數字開始算起添加,比如第一個count的結果會冠以列名_c0,接下來依次類推,默認值是_c,數據開發過程中應該很多人都看到過這個別名;

          hive.autogen.columnalias.prefix.includefuncname:在自動生成列別名時是否帶函數的名字,默認是false;

          hive.exec.perf.logger:負責記錄客戶端性能指標的日志類名,必須是org.apache.hadoop.hive.ql.log.PerfLogger的子類,默認是org.apache.hadoop.hive.ql.log.PerfLogger;

          hive.start.cleanup.scratchdir:當啟動hive服務時是否清空hive的scratch目錄,默認是false;

          hive.output.file.extension:輸出文件擴展名,默認是空;

          hive.insert.into.multilevel.dirs:是否插入到多級目錄,默認是false;

          hive.files.umask.value:hive創建文件夾時的dfs.umask值,默認是0002;

          posted on 2013-09-23 18:12 changedi 閱讀(4039) 評論(2)  編輯  收藏 所屬分類: 數據

          評論

          # re: Hive配置項的含義詳解(4) 2013-09-24 10:46 零柒鎖業

          接下來依次類推,默認值是_c,數據開發過程中應該很多人都看到過這個別名;
            回復  更多評論   

          # re: Hive配置項的含義詳解(4) 2013-09-26 09:20 零柒鎖業

          創建1臺用于跑DNS服務的虛擬機,假設名叫dnsserver  回復  更多評論   

          主站蜘蛛池模板: 甘南县| 绥化市| 鸡东县| 通州市| 汉阴县| 景宁| 高阳县| 都江堰市| 定结县| 自治县| 金阳县| 美姑县| 大余县| 阿合奇县| 太仆寺旗| 荣昌县| 岢岚县| 寿光市| SHOW| 开封县| 旬邑县| 晋中市| 东辽县| 醴陵市| 镇远县| 龙山县| 德惠市| 西安市| 淳化县| 武强县| 临安市| 安仁县| 莱阳市| 武汉市| 广德县| 安义县| 泰来县| 崇礼县| 贵阳市| 景德镇市| 定兴县|