海上月明

          editer by sun
          posts - 162, comments - 51, trackbacks - 0, articles - 8
             :: 首頁 :: 新隨筆 ::  :: 聚合  :: 管理

          PYTHON與EXCEL:openpyxl 讀寫excel2007

          Posted on 2014-11-21 09:34 pts 閱讀(3875) 評論(0)  編輯  收藏 所屬分類: Python

          【FROM】

          http://blog.csdn.net/suofiya2008/article/details/6284208

          有一萬年沒來這兒寫blog了,今天等著發(fā)版,抽空來寫點東西吧。

          python有很多模塊都是用來操作excel的,比如xlrd,xlwt,pyExcelerator。用著很方便,但是問題是,只能支持到 excel2003。雖然一般的應用其實足夠了,但是如果遇到了導出大量數(shù)據(jù)(超過65535條)的需求時,excel2003就不夠用了。所以我就只好 去找一個能支持excel2007的模塊。

          google了一下,發(fā)現(xiàn)了這個openpyxl,不過網(wǎng)上也沒什么中文的文檔可以看,于是就自己琢磨琢磨。

          I.安裝

          openpyxl的最新版本是1.5.0 下載地址 http://pypi.python.org/pypi/openpyxl/1.5.0

          需求python的版本是2.6+  ,也就是說,如果centOS系統(tǒng)的機器想用,那得升級系統(tǒng)的python。。。

          安裝就是解壓縮,然后cd到目錄,然后

          python setup.py install

          你懂的~

           II.讀取excel2007文件

          1. #-*- coding:utf-8 -*   
          2.   
          3. from  openpyxl.reader.excel  import  load_workbook  
          4. import  MySQLdb  
          5. import  time  
          6.   
          7. #開始時間   
          8. startTime = time.time()  
          9.   
          10. #讀取excel2007文件   
          11. wb = load_workbook(filename = r'empty_book.xlsx' )  
          12.   
          13. #顯示有多少張表   
          14. print   "Worksheet range(s):" , wb.get_named_ranges()  
          15. print   "Worksheet name(s):" , wb.get_sheet_names()  
          16.   
          17. #取第一張表   
          18. sheetnames = wb.get_sheet_names()  
          19. ws = wb.get_sheet_by_name(sheetnames[0 ])  
          20.   
          21. #顯示表名,表行數(shù),表列數(shù)   
          22. print   "Work Sheet Titile:" ,ws.title  
          23. print   "Work Sheet Rows:" ,ws.get_highest_row()  
          24. print   "Work Sheet Cols:" ,ws.get_highest_column()  
          25.   
          26.   
          27. # 建立存儲數(shù)據(jù)的字典    
          28. data_dic = {}   
          29.   
          30. #把數(shù)據(jù)存到字典中   
          31. for  rx  in  range(ws.get_highest_row()):  
          32.       
          33.     temp_list = []  
          34.     pid = ws.cell(row = rx,column = 0 ).value  
          35.     w1 = ws.cell(row = rx,column = 1 ).value  
          36.     w2 = ws.cell(row = rx,column = 2 ).value  
          37.     w3 = ws.cell(row = rx,column = 3 ).value  
          38.     w4 = ws.cell(row = rx,column = 4 ).value  
          39.     temp_list = [w1,w2,w3,w4]  
          40.      
          41.     data_dic[pid] = temp_list  
          42.   
          43. #打印字典數(shù)據(jù)個數(shù)   
          44. print   'Total:%d'  %len(data_dic)  

          1. #-*- coding:utf-8 -*  
          2. from openpyxl.reader.excel import load_workbook  
          3. import MySQLdb  
          4. import time  
          5. #開始時間  
          6. startTime = time.time()  
          7. #讀取excel2007文件  
          8. wb = load_workbook(filename = r'empty_book.xlsx')  
          9. #顯示有多少張表  
          10. print "Worksheet range(s):", wb.get_named_ranges()  
          11. print "Worksheet name(s):", wb.get_sheet_names()  
          12. #取第一張表  
          13. sheetnames = wb.get_sheet_names()  
          14. ws = wb.get_sheet_by_name(sheetnames[0])  
          15. #顯示表名,表行數(shù),表列數(shù)  
          16. print "Work Sheet Titile:",ws.title  
          17. print "Work Sheet Rows:",ws.get_highest_row()  
          18. print "Work Sheet Cols:",ws.get_highest_column()  
          19. # 建立存儲數(shù)據(jù)的字典   
          20. data_dic = {}   
          21. #把數(shù)據(jù)存到字典中  
          22. for rx in range(ws.get_highest_row()):  
          23.       
          24.     temp_list = []  
          25.     pid = ws.cell(row = rx,column = 0).value  
          26.     w1 = ws.cell(row = rx,column = 1).value  
          27.     w2 = ws.cell(row = rx,column = 2).value  
          28.     w3 = ws.cell(row = rx,column = 3).value  
          29.     w4 = ws.cell(row = rx,column = 4).value  
          30.     temp_list = [w1,w2,w3,w4]  
          31.      
          32.     data_dic[pid] = temp_list  
          33. #打印字典數(shù)據(jù)個數(shù)  
          34. print 'Total:%d' %len(data_dic)  

           

             

           注意的是ws.cell()方法,支持的參數(shù)有兩種,cell( coordinate=None , row=None , column=None)

          coordinate坐標,eg  ws.cell("B1")

          row 和 column 是行和列 ,都是從0開始

          還有,如果想取得格里的值,得用ws.cell("A1").value 取到,如果用過xlrd,因為寫法差不多,可能就會忘記加value了。

          III.寫入excel2007

           

          1. 寫excel2007  
          2.   
          3. #-*- coding:utf-8 -*   
          4.   
          5.   
          6. import  MySQLdb  
          7. import  time  
          8. import  sys  
          9. #workbook相關(guān)   
          10. from  openpyxl.workbook  import  Workbook  
          11. #萬惡的ExcelWriter,妹的封裝好了不早說,封裝了很強大的excel寫的功能   
          12. from  openpyxl.writer.excel  import  ExcelWriter  
          13. #一個eggache的數(shù)字轉(zhuǎn)為列字母的方法   
          14. from  openpyxl.cell  import  get_column_letter  
          15.   
          16.   
          17. #新建一個workbook   
          18.   
          19. wb = Workbook()  
          20. #新建一個excelWriter   
          21. ew = ExcelWriter(workbook = wb)  
          22.   
          23. #設置文件輸出路徑與名稱   
          24. dest_filename = r'empty_book.xlsx'   
          25.   
          26. #第一個sheet是ws   
          27. ws = wb.worksheets[0 ]  
          28.   
          29. #設置ws的名稱   
          30. ws.title = "range names"    
          31.   
          32.   
          33. #錄入數(shù)據(jù),注意col是數(shù)字轉(zhuǎn)字母,然后需要限定%s(string型)當參數(shù)傳到ws.cell()方法中去,records可以想象為一個從數(shù)據(jù)庫里查詢出來的數(shù)據(jù)集合   
          34. i=1   
          35. table = {}  
          36. for  record  in  records:  
          37.     for  x  in  range( 1 ,len(record)+ 1 ):  
          38.         col = get_column_letter(x)  
          39.         ws.cell('%s%s' %(col, i)).value =  '%s'  % (record[x- 1 ])        
          40.               
          41.     i+=1   
          42.   
          43. #又建了一個sheet,ws名字都沒變,太省了。。。但是確實是一個新的sheet,不會影響之前那個sheet的東西   
          44. ws = wb.create_sheet()  
          45.   
          46. ws.title = 'Pi'   
          47.   
          48. ws.cell('F5' ).value =  3.14   
          49.   
          50.       
          51. #寫文件   
          52. ew.save(filename = dest_filename)  

          1. 寫excel2007  
          2. #-*- coding:utf-8 -*  
          3. import MySQLdb  
          4. import time  
          5. import sys  
          6. #workbook相關(guān)  
          7. from openpyxl.workbook import Workbook  
          8. #萬惡的ExcelWriter,妹的封裝好了不早說,封裝了很強大的excel寫的功能  
          9. from openpyxl.writer.excel import ExcelWriter  
          10. #一個eggache的數(shù)字轉(zhuǎn)為列字母的方法  
          11. from openpyxl.cell import get_column_letter  
          12. #新建一個workbook  
          13. wb = Workbook()  
          14. #新建一個excelWriter  
          15. ew = ExcelWriter(workbook = wb)  
          16. #設置文件輸出路徑與名稱  
          17. dest_filename = r'empty_book.xlsx'  
          18. #第一個sheet是ws  
          19. ws = wb.worksheets[0]  
          20. #設置ws的名稱  
          21. ws.title = "range names"   
          22. #錄入數(shù)據(jù),注意col是數(shù)字轉(zhuǎn)字母,然后需要限定%s(string型)當參數(shù)傳到ws.cell()方法中去,records可以想象為一個從數(shù)據(jù)庫里查詢出來的數(shù)據(jù)集合  
          23. i=1  
          24. table = {}  
          25. for record in records:  
          26.     for x in range(1,len(record)+1):  
          27.         col = get_column_letter(x)  
          28.         ws.cell('%s%s'%(col, i)).value = '%s' % (record[x-1])        
          29.               
          30.     i+=1  
          31. #又建了一個sheet,ws名字都沒變,太省了。。。但是確實是一個新的sheet,不會影響之前那個sheet的東西  
          32. ws = wb.create_sheet()  
          33. ws.title = 'Pi'  
          34. ws.cell('F5').value = 3.14  
          35.       
          36. #寫文件  
          37. ew.save(filename = dest_filename)  

           

           注意的地方:

          # col是用列號x為參數(shù),調(diào)用了這個模塊的get_column_letter方法算出來的字母,這個比較蛋疼。

              col = get_column_letter(x)

           

          #在為數(shù)據(jù)格賦值的時候,注意寫的格式:要不會有各種不靠譜的問題出現(xiàn)(這個是用坐標的方式寫的,其實用row ,col的方式可能沒那么麻煩)

              ws.cell( '%s%s'%(col, i) ).value = '%s' % (record[x-1])

          關(guān)于該模塊的API  可以查詢官方文檔   http://packages.python.org/openpyxl/api.html

          總體來說,這個模塊還是挺方便的,但是問題就是在對于python的版本有一定要求,如果在centOs上用,可能會有些問題。

          本文只是簡單的寫了下使用的方法,之后格式超鏈接神馬的之后再填上~

          主站蜘蛛池模板: 白银市| 青川县| 台湾省| 巴彦淖尔市| 射洪县| 晋州市| 樟树市| 双流县| 临泽县| 商南县| 镶黄旗| 社旗县| 大竹县| 乐昌市| 旌德县| 周口市| 常州市| 卢龙县| 昌宁县| 邳州市| 浦江县| 梅河口市| 南充市| 吴川市| 武川县| 卓尼县| 砀山县| 和政县| 磐石市| 苍梧县| 麦盖提县| 象山县| 江川县| 迁西县| 溧阳市| 巴东县| 临武县| 乐山市| 株洲县| 枣阳市| 常德市|