大漠駝鈴

          置身浩瀚的沙漠,方向最為重要,希望此blog能向大漠駝鈴一樣,給我方向和指引。
          Java,Php,Shell,Python,服務器運維,大數據,SEO, 網站開發、運維,云服務技術支持,IM服務供應商, FreeSwitch搭建,技術支持等. 技術討論QQ群:428622099
          隨筆 - 238, 文章 - 3, 評論 - 117, 引用 - 0
          數據加載中……

          Python IO

          1.open

          使用open打開文件后一定要記得調用文件對象的close()方法。比如可以用try/finally語句來確保最后能關閉文件。

          file_object = open('thefile.txt')
          try:
               all_the_text 
          = file_object.read( )
          finally:
               file_object.close( )


          注:不能把open語句放在try塊里,因為當打開文件出現異常時,文件對象file_object無法執行close()方法。

          2.讀文件

          讀文本文件

          input = open('data''r')
          #第二個參數默認為r
          input = open('data')

           

          讀二進制文件

          input = open('data''rb')

           

          讀取所有內容

          file_object = open('thefile.txt')
          try:
               all_the_text 
          = file_object.read( )
          finally:
               file_object.close( )

           

          讀固定字節

          file_object = open('abinfile''rb')
          try:
              
          while True:
                   chunk 
          = file_object.read(100)
                  
          if not chunk:
                      
          break
                   do_something_with(chunk)
          finally:
               file_object.close( )

           

          讀每行

          list_of_all_the_lines = file_object.readlines( )


          如果文件是文本文件,還可以直接遍歷文件對象獲取每行:

          for line in file_object:
               process line

           

          3.寫文件

          寫文本文件

          output = open('data''w')

           

          寫二進制文件

          output = open('data''wb')

           

          追加寫文件

          output = open('data''w+')

           

          寫數據

          file_object = open('thefile.txt''w')
          file_object.write(all_the_text)
          file_object.close( )

           

          寫入多行

          file_object.writelines(list_of_text_strings)


          注意,調用writelines寫入多行在性能上會比使用write一次性寫入要高。

          在處理日志文件的時候,常常會遇到這樣的情況:日志文件巨大,不可能一次性把整個文件讀入到內存中進行處理,例如需要在一臺物理內存為 2GB 的機器上處理一個 2GB 的日志文件,我們可能希望每次只處理其中 200MB 的內容。
          在 Python 中,內置的 File 對象直接提供了一個 readlines(sizehint) 函數來完成這樣的事情。以下面的代碼為例:

          file = open('test.log', 'r')
          sizehint
          = 209715200   # 200M
          position = 0
          lines
          = file.readlines(sizehint)
          while not file.tell() - position < 0:
               position
          = file.tell()
               lines
          = file.readlines(sizehint)



          每次調用 readlines(sizehint) 函數,會返回大約 200MB 的數據,而且所返回的必然都是完整的行數據,大多數情況下,返回的數據的字節數會稍微比 sizehint 指定的值大一點(除最后一次調用 readlines(sizehint) 函數的時候)。通常情況下,Python 會自動將用戶指定的 sizehint 的值調整成內部緩存大小的整數倍。

          file在python是一個特殊的類型,它用于在python程序中對外部的文件進行操作。在python中一切都是對象,file也不例外,file有file的方法和屬性。下面先來看如何創建一個file對象:

          file(name[, mode[, buffering]])
          file()函數用于創建一個file對象,它有一個別名叫open(),可能更形象一些,它們是內置函數。來看看它的參數。它參數都是以字符串的形式傳遞的。name是文件的名字。
          mode是打開的模式,可選的值為r w a U,分別代表讀(默認) 寫 添加 支持各種換行符的模式。用w或a模式打開文件的話,如果文件不存在,那么就自動創建。此外,用w模式打開一個已經存在的文件時,原有文件的內容會被清空,因為一開始文件的操作的標記是在文件的開頭的,這時候進行寫操作,無疑會把原有的內容給抹掉。由于歷史的原因,換行符在不同的系統中有不同模式,比如在 unix中是一個\n,而在windows中是‘\r\n’,用U模式打開文件,就是支持所有的換行模式,也就說‘\r’ '\n' '\r\n'都可表示換行,會有一個tuple用來存貯這個文件中用到過的換行符。不過,雖說換行有多種模式,讀到python中統一用\n代替。在模式字符的后面,還可以加上+ b t這兩種標識,分別表示可以對文件同時進行讀寫操作和用二進制模式、文本模式(默認)打開文件。
          buffering如果為0表示不進行緩沖;如果為1表示進行“行緩沖“;如果是一個大于1的數表示緩沖區的大小,應該是以字節為單位的。

          file對象有自己的屬性和方法。先來看看file的屬性。

          closed #標記文件是否已經關閉,由close()改寫
          encoding #文件編碼
          mode #打開模式
          name #文件名
          newlines #文件中用到的換行模式,是一個tuple
          softspace #boolean型,一般為0,據說用于print

          file的讀寫方法:

          F.read([size]) #size為讀取的長度,以byte為單位
          F.readline([size]) 
          #讀一行,如果定義了size,有可能返回的只是一行的一部分
          F.readlines([size]) 
          #把文件每一行作為一個list的一個成員,并返回這個list。其實它的內部是通過循環調用readline()來實現的。如果提供size參數,size是表示讀取內容的總長,也就是說可能只讀到文件的一部分。
          F.write(str) 
          #把str寫到文件中,write()并不會在str后加上一個換行符
          F.writelines(seq) 
          #把seq的內容全部寫到文件中。這個函數也只是忠實地寫入,不會在每行后面加上任何東西。
          file的其他方法:

          F.close() 
          #關閉文件。python會在一個文件不用后自動關閉文件,不過這一功能沒有保證,最好還是養成自己關閉的習慣。如果一個文件在關閉后還對其進行操作會產生ValueError
          F.flush() 
          #把緩沖區的內容寫入硬盤
          F.fileno() 
          #返回一個長整型的”文件標簽“
          F.isatty() 
          #文件是否是一個終端設備文件(unix系統中的)
          F.tell() 
          #返回文件操作標記的當前位置,以文件的開頭為原點
          F.next() 
          #返回下一行,并將文件操作標記位移到下一行。把一個file用于for ... in file這樣的語句時,就是調用next()函數來實現遍歷的。
          F.seek(offset[,whence]) 
          #將文件打操作標記移到offset的位置。這個offset一般是相對于文件的開頭來計算的,一般為正數。但如果提供了whence參數就不一定了,whence可以為0表示從頭開始計算,1表示以當前位置為原點計算。2表示以文件末尾為原點進行計算。需要注意,如果文件以a或a+的模式打開,每次進行寫操作時,文件操作標記會自動返回到文件末尾。
          F.truncate([size]) 
          #把文件裁成規定的大小,默認的是裁到當前文件操作標記的位置。如果size比文件的大小還要大,依據系統的不同可能是不改變文件,也可能是用0把文件補到相應的大小,也可能是以一些隨機的內容加上去。

           

          posted on 2011-03-04 16:10 草原上的駱駝 閱讀(887) 評論(0)  編輯  收藏 所屬分類: Python

          主站蜘蛛池模板: 浮山县| 合阳县| 安新县| 宝清县| 高碑店市| 吴旗县| 永嘉县| 芷江| 信阳市| 玉田县| 浠水县| 观塘区| 定陶县| 黔江区| 舟曲县| 梨树县| 平原县| 望城县| 沁阳市| 广州市| 茶陵县| 浪卡子县| 吐鲁番市| 米泉市| 赫章县| 竹山县| 临湘市| 浙江省| 图片| 北碚区| 赣州市| 华亭县| 松潘县| 大冶市| 广西| 湖北省| 文水县| 米易县| 锡林浩特市| 亚东县| 夏津县|