閔毓
          http://www.eshoo.com.cn 歡迎來到異客中國
          posts - 49,comments - 97,trackbacks - 0

          近日有一文本文件,數(shù)據(jù)格式是以tab分割。數(shù)據(jù)量有數(shù)千萬條數(shù)據(jù),需要導(dǎo)入mysql數(shù)據(jù)庫中,通過傳統(tǒng)的方式進(jìn)行拷貝到數(shù)據(jù)庫中,需要花費(fèi)很多天時(shí)間,中間也會(huì)出現(xiàn)很多錯(cuò)誤,未必能導(dǎo)入成功。
          使用:load data local infile "本地路徑" into table 表名命令方式進(jìn)行導(dǎo)入,10w條數(shù)據(jù)也只需要花費(fèi)幾秒鐘時(shí)間,可中文無法導(dǎo)入。
          仔細(xì)分析了一下:
                 建庫時(shí)采用utf8編碼,表也是utf8編碼。對中文應(yīng)該是支持的。排除數(shù)據(jù)庫的問題。
                 只能從要導(dǎo)入的文本文件考慮,將其編碼用ultraEdit轉(zhuǎn)換編碼為utf8后,進(jìn)行導(dǎo)入,成功導(dǎo)入。數(shù)據(jù)也沒有出現(xiàn)錯(cuò)誤。 

          也可采用select * from 表名 into outfile "c:\\文件路徑";進(jìn)行查詢;進(jìn)行導(dǎo)出表中的數(shù)據(jù)為文本文件格式。
          也可以采用select * from 表名 into outfile "c:\\stu_t.txt" lines terminated by '\r\n';進(jìn)行查詢,導(dǎo)出。
          posted on 2007-10-16 17:10 閔毓 閱讀(7032) 評(píng)論(0)  編輯  收藏 所屬分類: 數(shù)據(jù)庫心得與體會(huì)
          主站蜘蛛池模板: 秭归县| 岳西县| 乌鲁木齐市| 洪湖市| 溧水县| 扶绥县| 江安县| 淮阳县| 文成县| 无锡市| 临漳县| 龙陵县| 新余市| 卓资县| 敦煌市| 滨州市| 新绛县| 仁寿县| 石楼县| 宁都县| 镇坪县| 邢台市| 沈丘县| 修文县| 建昌县| 宜城市| 陇西县| 延安市| 芜湖县| 浦东新区| 永登县| 八宿县| 揭阳市| 商南县| 班戈县| 永平县| 大悟县| 平遥县| 措勤县| 新蔡县| 克东县|