PYTHON與EXCEL:openpyxl 讀寫excel2007
Posted on 2014-11-21 09:34 pts 閱讀(3875) 評(píng)論(0) 編輯 收藏 所屬分類: Python【FROM】
http://blog.csdn.net/suofiya2008/article/details/6284208
有一萬年沒來這兒寫blog了,今天等著發(fā)版,抽空來寫點(diǎn)東西吧。
python有很多模塊都是用來操作excel的,比如xlrd,xlwt,pyExcelerator。用著很方便,但是問題是,只能支持到 excel2003。雖然一般的應(yīng)用其實(shí)足夠了,但是如果遇到了導(dǎo)出大量數(shù)據(jù)(超過65535條)的需求時(shí),excel2003就不夠用了。所以我就只好 去找一個(gè)能支持excel2007的模塊。
google了一下,發(fā)現(xiàn)了這個(gè)openpyxl,不過網(wǎng)上也沒什么中文的文檔可以看,于是就自己琢磨琢磨。
I.安裝
openpyxl的最新版本是1.5.0 下載地址 http://pypi.python.org/pypi/openpyxl/1.5.0
需求python的版本是2.6+ ,也就是說,如果centOS系統(tǒng)的機(jī)器想用,那得升級(jí)系統(tǒng)的python。。。
安裝就是解壓縮,然后cd到目錄,然后
python setup.py install
你懂的~
II.讀取excel2007文件
- #-*- coding:utf-8 -*
- from openpyxl.reader.excel import load_workbook
- import MySQLdb
- import time
- #開始時(shí)間
- startTime = time.time()
- #讀取excel2007文件
- wb = load_workbook(filename = r'empty_book.xlsx' )
- #顯示有多少張表
- print "Worksheet range(s):" , wb.get_named_ranges()
- print "Worksheet name(s):" , wb.get_sheet_names()
- #取第一張表
- sheetnames = wb.get_sheet_names()
- ws = wb.get_sheet_by_name(sheetnames[0 ])
- #顯示表名,表行數(shù),表列數(shù)
- print "Work Sheet Titile:" ,ws.title
- print "Work Sheet Rows:" ,ws.get_highest_row()
- print "Work Sheet Cols:" ,ws.get_highest_column()
- # 建立存儲(chǔ)數(shù)據(jù)的字典
- data_dic = {}
- #把數(shù)據(jù)存到字典中
- for rx in range(ws.get_highest_row()):
- temp_list = []
- pid = ws.cell(row = rx,column = 0 ).value
- w1 = ws.cell(row = rx,column = 1 ).value
- w2 = ws.cell(row = rx,column = 2 ).value
- w3 = ws.cell(row = rx,column = 3 ).value
- w4 = ws.cell(row = rx,column = 4 ).value
- temp_list = [w1,w2,w3,w4]
- data_dic[pid] = temp_list
- #打印字典數(shù)據(jù)個(gè)數(shù)
- print 'Total:%d' %len(data_dic)
- #-*- coding:utf-8 -*
- from openpyxl.reader.excel import load_workbook
- import MySQLdb
- import time
- #開始時(shí)間
- startTime = time.time()
- #讀取excel2007文件
- wb = load_workbook(filename = r'empty_book.xlsx')
- #顯示有多少張表
- print "Worksheet range(s):", wb.get_named_ranges()
- print "Worksheet name(s):", wb.get_sheet_names()
- #取第一張表
- sheetnames = wb.get_sheet_names()
- ws = wb.get_sheet_by_name(sheetnames[0])
- #顯示表名,表行數(shù),表列數(shù)
- print "Work Sheet Titile:",ws.title
- print "Work Sheet Rows:",ws.get_highest_row()
- print "Work Sheet Cols:",ws.get_highest_column()
- # 建立存儲(chǔ)數(shù)據(jù)的字典
- data_dic = {}
- #把數(shù)據(jù)存到字典中
- for rx in range(ws.get_highest_row()):
- temp_list = []
- pid = ws.cell(row = rx,column = 0).value
- w1 = ws.cell(row = rx,column = 1).value
- w2 = ws.cell(row = rx,column = 2).value
- w3 = ws.cell(row = rx,column = 3).value
- w4 = ws.cell(row = rx,column = 4).value
- temp_list = [w1,w2,w3,w4]
- data_dic[pid] = temp_list
- #打印字典數(shù)據(jù)個(gè)數(shù)
- print 'Total:%d' %len(data_dic)
注意的是ws.cell()方法,支持的參數(shù)有兩種,cell( coordinate=None , row=None , column=None)
coordinate坐標(biāo),eg ws.cell("B1")
row 和 column 是行和列 ,都是從0開始
還有,如果想取得格里的值,得用ws.cell("A1").value 取到,如果用過xlrd,因?yàn)閷懛ú畈欢啵赡芫蜁?huì)忘記加value了。
III.寫入excel2007
- 寫excel2007
- #-*- coding:utf-8 -*
- import MySQLdb
- import time
- import sys
- #workbook相關(guān)
- from openpyxl.workbook import Workbook
- #萬惡的ExcelWriter,妹的封裝好了不早說,封裝了很強(qiáng)大的excel寫的功能
- from openpyxl.writer.excel import ExcelWriter
- #一個(gè)eggache的數(shù)字轉(zhuǎn)為列字母的方法
- from openpyxl.cell import get_column_letter
- #新建一個(gè)workbook
- wb = Workbook()
- #新建一個(gè)excelWriter
- ew = ExcelWriter(workbook = wb)
- #設(shè)置文件輸出路徑與名稱
- dest_filename = r'empty_book.xlsx'
- #第一個(gè)sheet是ws
- ws = wb.worksheets[0 ]
- #設(shè)置ws的名稱
- ws.title = "range names"
- #錄入數(shù)據(jù),注意col是數(shù)字轉(zhuǎn)字母,然后需要限定%s(string型)當(dāng)參數(shù)傳到ws.cell()方法中去,records可以想象為一個(gè)從數(shù)據(jù)庫里查詢出來的數(shù)據(jù)集合
- i=1
- table = {}
- for record in records:
- for x in range( 1 ,len(record)+ 1 ):
- col = get_column_letter(x)
- ws.cell('%s%s' %(col, i)).value = '%s' % (record[x- 1 ])
- i+=1
- #又建了一個(gè)sheet,ws名字都沒變,太省了。。。但是確實(shí)是一個(gè)新的sheet,不會(huì)影響之前那個(gè)sheet的東西
- ws = wb.create_sheet()
- ws.title = 'Pi'
- ws.cell('F5' ).value = 3.14
- #寫文件
- ew.save(filename = dest_filename)
- 寫excel2007
- #-*- coding:utf-8 -*
- import MySQLdb
- import time
- import sys
- #workbook相關(guān)
- from openpyxl.workbook import Workbook
- #萬惡的ExcelWriter,妹的封裝好了不早說,封裝了很強(qiáng)大的excel寫的功能
- from openpyxl.writer.excel import ExcelWriter
- #一個(gè)eggache的數(shù)字轉(zhuǎn)為列字母的方法
- from openpyxl.cell import get_column_letter
- #新建一個(gè)workbook
- wb = Workbook()
- #新建一個(gè)excelWriter
- ew = ExcelWriter(workbook = wb)
- #設(shè)置文件輸出路徑與名稱
- dest_filename = r'empty_book.xlsx'
- #第一個(gè)sheet是ws
- ws = wb.worksheets[0]
- #設(shè)置ws的名稱
- ws.title = "range names"
- #錄入數(shù)據(jù),注意col是數(shù)字轉(zhuǎn)字母,然后需要限定%s(string型)當(dāng)參數(shù)傳到ws.cell()方法中去,records可以想象為一個(gè)從數(shù)據(jù)庫里查詢出來的數(shù)據(jù)集合
- i=1
- table = {}
- for record in records:
- for x in range(1,len(record)+1):
- col = get_column_letter(x)
- ws.cell('%s%s'%(col, i)).value = '%s' % (record[x-1])
- i+=1
- #又建了一個(gè)sheet,ws名字都沒變,太省了。。。但是確實(shí)是一個(gè)新的sheet,不會(huì)影響之前那個(gè)sheet的東西
- ws = wb.create_sheet()
- ws.title = 'Pi'
- ws.cell('F5').value = 3.14
- #寫文件
- ew.save(filename = dest_filename)
注意的地方:
# col是用列號(hào)x為參數(shù),調(diào)用了這個(gè)模塊的get_column_letter方法算出來的字母,這個(gè)比較蛋疼。
col = get_column_letter(x)
#在為數(shù)據(jù)格賦值的時(shí)候,注意寫的格式:要不會(huì)有各種不靠譜的問題出現(xiàn)(這個(gè)是用坐標(biāo)的方式寫的,其實(shí)用row ,col的方式可能沒那么麻煩)
ws.cell( '%s%s'%(col, i) ).value = '%s' % (record[x-1])
關(guān)于該模塊的API 可以查詢官方文檔 http://packages.python.org/openpyxl/api.html
總體來說,這個(gè)模塊還是挺方便的,但是問題就是在對(duì)于python的版本有一定要求,如果在centOs上用,可能會(huì)有些問題。
本文只是簡(jiǎn)單的寫了下使用的方法,之后格式超鏈接神馬的之后再填上~
的處理