大漠駝鈴

          置身浩瀚的沙漠,方向最為重要,希望此blog能向大漠駝鈴一樣,給我方向和指引。
          Java,Php,Shell,Python,服務(wù)器運(yùn)維,大數(shù)據(jù),SEO, 網(wǎng)站開(kāi)發(fā)、運(yùn)維,云服務(wù)技術(shù)支持,IM服務(wù)供應(yīng)商, FreeSwitch搭建,技術(shù)支持等. 技術(shù)討論QQ群:428622099
          隨筆 - 238, 文章 - 3, 評(píng)論 - 117, 引用 - 0
          數(shù)據(jù)加載中……

          Python IO

          1.open

          使用open打開(kāi)文件后一定要記得調(diào)用文件對(duì)象的close()方法。比如可以用try/finally語(yǔ)句來(lái)確保最后能關(guān)閉文件。

          file_object = open('thefile.txt')
          try:
               all_the_text 
          = file_object.read( )
          finally:
               file_object.close( )


          注:不能把open語(yǔ)句放在try塊里,因?yàn)楫?dāng)打開(kāi)文件出現(xiàn)異常時(shí),文件對(duì)象file_object無(wú)法執(zhí)行close()方法。

          2.讀文件

          讀文本文件

          input = open('data''r')
          #第二個(gè)參數(shù)默認(rèn)為r
          input = open('data')

           

          讀二進(jìn)制文件

          input = open('data''rb')

           

          讀取所有內(nèi)容

          file_object = open('thefile.txt')
          try:
               all_the_text 
          = file_object.read( )
          finally:
               file_object.close( )

           

          讀固定字節(jié)

          file_object = open('abinfile''rb')
          try:
              
          while True:
                   chunk 
          = file_object.read(100)
                  
          if not chunk:
                      
          break
                   do_something_with(chunk)
          finally:
               file_object.close( )

           

          讀每行

          list_of_all_the_lines = file_object.readlines( )


          如果文件是文本文件,還可以直接遍歷文件對(duì)象獲取每行:

          for line in file_object:
               process line

           

          3.寫(xiě)文件

          寫(xiě)文本文件

          output = open('data''w')

           

          寫(xiě)二進(jìn)制文件

          output = open('data''wb')

           

          追加寫(xiě)文件

          output = open('data''w+')

           

          寫(xiě)數(shù)據(jù)

          file_object = open('thefile.txt''w')
          file_object.write(all_the_text)
          file_object.close( )

           

          寫(xiě)入多行

          file_object.writelines(list_of_text_strings)


          注意,調(diào)用writelines寫(xiě)入多行在性能上會(huì)比使用write一次性寫(xiě)入要高。

          在處理日志文件的時(shí)候,常常會(huì)遇到這樣的情況:日志文件巨大,不可能一次性把整個(gè)文件讀入到內(nèi)存中進(jìn)行處理,例如需要在一臺(tái)物理內(nèi)存為 2GB 的機(jī)器上處理一個(gè) 2GB 的日志文件,我們可能希望每次只處理其中 200MB 的內(nèi)容。
          在 Python 中,內(nèi)置的 File 對(duì)象直接提供了一個(gè) readlines(sizehint) 函數(shù)來(lái)完成這樣的事情。以下面的代碼為例:

          file = open('test.log', 'r')
          sizehint
          = 209715200   # 200M
          position = 0
          lines
          = file.readlines(sizehint)
          while not file.tell() - position < 0:
               position
          = file.tell()
               lines
          = file.readlines(sizehint)



          每次調(diào)用 readlines(sizehint) 函數(shù),會(huì)返回大約 200MB 的數(shù)據(jù),而且所返回的必然都是完整的行數(shù)據(jù),大多數(shù)情況下,返回的數(shù)據(jù)的字節(jié)數(shù)會(huì)稍微比 sizehint 指定的值大一點(diǎn)(除最后一次調(diào)用 readlines(sizehint) 函數(shù)的時(shí)候)。通常情況下,Python 會(huì)自動(dòng)將用戶(hù)指定的 sizehint 的值調(diào)整成內(nèi)部緩存大小的整數(shù)倍。

          file在python是一個(gè)特殊的類(lèi)型,它用于在python程序中對(duì)外部的文件進(jìn)行操作。在python中一切都是對(duì)象,file也不例外,file有file的方法和屬性。下面先來(lái)看如何創(chuàng)建一個(gè)file對(duì)象:

          file(name[, mode[, buffering]])
          file()函數(shù)用于創(chuàng)建一個(gè)file對(duì)象,它有一個(gè)別名叫open(),可能更形象一些,它們是內(nèi)置函數(shù)。來(lái)看看它的參數(shù)。它參數(shù)都是以字符串的形式傳遞的。name是文件的名字。
          mode是打開(kāi)的模式,可選的值為r w a U,分別代表讀(默認(rèn)) 寫(xiě) 添加 支持各種換行符的模式。用w或a模式打開(kāi)文件的話,如果文件不存在,那么就自動(dòng)創(chuàng)建。此外,用w模式打開(kāi)一個(gè)已經(jīng)存在的文件時(shí),原有文件的內(nèi)容會(huì)被清空,因?yàn)橐婚_(kāi)始文件的操作的標(biāo)記是在文件的開(kāi)頭的,這時(shí)候進(jìn)行寫(xiě)操作,無(wú)疑會(huì)把原有的內(nèi)容給抹掉。由于歷史的原因,換行符在不同的系統(tǒng)中有不同模式,比如在 unix中是一個(gè)\n,而在windows中是‘\r\n’,用U模式打開(kāi)文件,就是支持所有的換行模式,也就說(shuō)‘\r’ '\n' '\r\n'都可表示換行,會(huì)有一個(gè)tuple用來(lái)存貯這個(gè)文件中用到過(guò)的換行符。不過(guò),雖說(shuō)換行有多種模式,讀到python中統(tǒng)一用\n代替。在模式字符的后面,還可以加上+ b t這兩種標(biāo)識(shí),分別表示可以對(duì)文件同時(shí)進(jìn)行讀寫(xiě)操作和用二進(jìn)制模式、文本模式(默認(rèn))打開(kāi)文件。
          buffering如果為0表示不進(jìn)行緩沖;如果為1表示進(jìn)行“行緩沖“;如果是一個(gè)大于1的數(shù)表示緩沖區(qū)的大小,應(yīng)該是以字節(jié)為單位的。

          file對(duì)象有自己的屬性和方法。先來(lái)看看file的屬性。

          closed #標(biāo)記文件是否已經(jīng)關(guān)閉,由close()改寫(xiě)
          encoding #文件編碼
          mode #打開(kāi)模式
          name #文件名
          newlines #文件中用到的換行模式,是一個(gè)tuple
          softspace #boolean型,一般為0,據(jù)說(shuō)用于print

          file的讀寫(xiě)方法:

          F.read([size]) #size為讀取的長(zhǎng)度,以byte為單位
          F.readline([size]) 
          #讀一行,如果定義了size,有可能返回的只是一行的一部分
          F.readlines([size]) 
          #把文件每一行作為一個(gè)list的一個(gè)成員,并返回這個(gè)list。其實(shí)它的內(nèi)部是通過(guò)循環(huán)調(diào)用readline()來(lái)實(shí)現(xiàn)的。如果提供size參數(shù),size是表示讀取內(nèi)容的總長(zhǎng),也就是說(shuō)可能只讀到文件的一部分。
          F.write(str) 
          #把str寫(xiě)到文件中,write()并不會(huì)在str后加上一個(gè)換行符
          F.writelines(seq) 
          #把seq的內(nèi)容全部寫(xiě)到文件中。這個(gè)函數(shù)也只是忠實(shí)地寫(xiě)入,不會(huì)在每行后面加上任何東西。
          file的其他方法:

          F.close() 
          #關(guān)閉文件。python會(huì)在一個(gè)文件不用后自動(dòng)關(guān)閉文件,不過(guò)這一功能沒(méi)有保證,最好還是養(yǎng)成自己關(guān)閉的習(xí)慣。如果一個(gè)文件在關(guān)閉后還對(duì)其進(jìn)行操作會(huì)產(chǎn)生ValueError
          F.flush() 
          #把緩沖區(qū)的內(nèi)容寫(xiě)入硬盤(pán)
          F.fileno() 
          #返回一個(gè)長(zhǎng)整型的”文件標(biāo)簽“
          F.isatty() 
          #文件是否是一個(gè)終端設(shè)備文件(unix系統(tǒng)中的)
          F.tell() 
          #返回文件操作標(biāo)記的當(dāng)前位置,以文件的開(kāi)頭為原點(diǎn)
          F.next() 
          #返回下一行,并將文件操作標(biāo)記位移到下一行。把一個(gè)file用于for ... in file這樣的語(yǔ)句時(shí),就是調(diào)用next()函數(shù)來(lái)實(shí)現(xiàn)遍歷的。
          F.seek(offset[,whence]) 
          #將文件打操作標(biāo)記移到offset的位置。這個(gè)offset一般是相對(duì)于文件的開(kāi)頭來(lái)計(jì)算的,一般為正數(shù)。但如果提供了whence參數(shù)就不一定了,whence可以為0表示從頭開(kāi)始計(jì)算,1表示以當(dāng)前位置為原點(diǎn)計(jì)算。2表示以文件末尾為原點(diǎn)進(jìn)行計(jì)算。需要注意,如果文件以a或a+的模式打開(kāi),每次進(jìn)行寫(xiě)操作時(shí),文件操作標(biāo)記會(huì)自動(dòng)返回到文件末尾。
          F.truncate([size]) 
          #把文件裁成規(guī)定的大小,默認(rèn)的是裁到當(dāng)前文件操作標(biāo)記的位置。如果size比文件的大小還要大,依據(jù)系統(tǒng)的不同可能是不改變文件,也可能是用0把文件補(bǔ)到相應(yīng)的大小,也可能是以一些隨機(jī)的內(nèi)容加上去。

           

          posted on 2011-03-04 16:10 草原上的駱駝 閱讀(893) 評(píng)論(0)  編輯  收藏 所屬分類(lèi): Python

          主站蜘蛛池模板: 临桂县| 金阳县| 黄梅县| 遵义县| 永修县| 潞西市| 晋中市| 新沂市| 莒南县| 安化县| 红安县| 广安市| 石嘴山市| 兴国县| 武夷山市| 那坡县| 南宫市| 古浪县| 大港区| 施甸县| 莒南县| 宿松县| 长治县| 从江县| 邵阳市| 门源| 南漳县| 盘山县| 镇远县| 赣州市| 雷山县| 新建县| 崇左市| 双辽市| 周口市| 江油市| 定结县| 紫云| 皮山县| 温泉县| 韩城市|