大漠駝鈴

置身浩瀚的沙漠，方向最為重要，希望此blog能向大漠駝鈴一樣，給我方向和指引。
Java,Php,Shell,Python,服務器運維,大數據，SEO, 網站開發、運維,云服務技術支持，IM服務供應商, FreeSwitch搭建，技術支持等. 技術討論QQ群：428622099

隨筆 - 238, 文章 - 3, 評論 - 117, 引用 - 0

數據加載中……

Python IO

1.open

使用open打開文件后一定要記得調用文件對象的close()方法。比如可以用try/finally語句來確保最后能關閉文件。

file_object = open('thefile.txt')

try:

all_the_text = file_object.read( )

finally:

file_object.close( )

注：不能把open語句放在try塊里，因為當打開文件出現異常時，文件對象file_object無法執行close()方法。

2.讀文件

讀文本文件

input = open('data', 'r')

#第二個參數默認為r

input = open('data')

讀二進制文件

input = open('data', 'rb')

讀取所有內容

file_object = open('thefile.txt')

try:

all_the_text = file_object.read( )

finally:

file_object.close( )

讀固定字節

file_object = open('abinfile', 'rb')

try:

while True:

chunk = file_object.read(100)

if not chunk:

break

do_something_with(chunk)

finally:

file_object.close( )

讀每行

list_of_all_the_lines = file_object.readlines( )

如果文件是文本文件，還可以直接遍歷文件對象獲取每行：

for line in file_object:

process line

3.寫文件

寫文本文件

output = open('data', 'w')

寫二進制文件

output = open('data', 'wb')

追加寫文件

output = open('data', 'w+')

寫數據

file_object = open('thefile.txt', 'w')

file_object.write(all_the_text)

file_object.close( )

寫入多行

file_object.writelines(list_of_text_strings)

注意，調用writelines寫入多行在性能上會比使用write一次性寫入要高。

在處理日志文件的時候，常常會遇到這樣的情況：日志文件巨大，不可能一次性把整個文件讀入到內存中進行處理，例如需要在一臺物理內存為 2GB 的機器上處理一個 2GB 的日志文件，我們可能希望每次只處理其中 200MB 的內容。
在 Python 中，內置的 File 對象直接提供了一個 readlines(sizehint) 函數來完成這樣的事情。以下面的代碼為例：

file = open('test.log', 'r')

sizehint = 209715200   # 200M

position = 0

lines = file.readlines(sizehint)

while not file.tell() - position < 0:

       position = file.tell()

       lines = file.readlines(sizehint)

每次調用 readlines(sizehint) 函數，會返回大約 200MB 的數據，而且所返回的必然都是完整的行數據，大多數情況下，返回的數據的字節數會稍微比 sizehint 指定的值大一點（除最后一次調用 readlines(sizehint) 函數的時候）。通常情況下，Python 會自動將用戶指定的 sizehint 的值調整成內部緩存大小的整數倍。

file在python是一個特殊的類型，它用于在python程序中對外部的文件進行操作。在python中一切都是對象，file也不例外，file有file的方法和屬性。下面先來看如何創建一個file對象：

file(name[, mode[, buffering]])

file()函數用于創建一個file對象，它有一個別名叫open()，可能更形象一些，它們是內置函數。來看看它的參數。它參數都是以字符串的形式傳遞的。name是文件的名字。

mode是打開的模式，可選的值為r w a U，分別代表讀（默認）寫添加支持各種換行符的模式。用w或a模式打開文件的話，如果文件不存在，那么就自動創建。此外，用w模式打開一個已經存在的文件時，原有文件的內容會被清空，因為一開始文件的操作的標記是在文件的開頭的，這時候進行寫操作，無疑會把原有的內容給抹掉。由于歷史的原因，換行符在不同的系統中有不同模式，比如在 unix中是一個\n，而在windows中是‘\r\n’，用U模式打開文件，就是支持所有的換行模式，也就說‘\r’ '\n' '\r\n'都可表示換行，會有一個tuple用來存貯這個文件中用到過的換行符。不過，雖說換行有多種模式，讀到python中統一用\n代替。在模式字符的后面，還可以加上+ b t這兩種標識，分別表示可以對文件同時進行讀寫操作和用二進制模式、文本模式（默認）打開文件。

buffering如果為0表示不進行緩沖;如果為1表示進行“行緩沖“;如果是一個大于1的數表示緩沖區的大小，應該是以字節為單位的。

file對象有自己的屬性和方法。先來看看file的屬性。

closed #標記文件是否已經關閉，由close()改寫

encoding #文件編碼

mode #打開模式

name #文件名

newlines #文件中用到的換行模式，是一個tuple

softspace #boolean型，一般為0，據說用于print

file的讀寫方法：

F.read([size]) #size為讀取的長度，以byte為單位

F.readline([size])

#讀一行，如果定義了size，有可能返回的只是一行的一部分

F.readlines([size])

#把文件每一行作為一個list的一個成員，并返回這個list。其實它的內部是通過循環調用readline()來實現的。如果提供size參數，size是表示讀取內容的總長，也就是說可能只讀到文件的一部分。

F.write(str)

#把str寫到文件中，write()并不會在str后加上一個換行符

F.writelines(seq)

#把seq的內容全部寫到文件中。這個函數也只是忠實地寫入，不會在每行后面加上任何東西。

file的其他方法：

F.close()

#關閉文件。python會在一個文件不用后自動關閉文件，不過這一功能沒有保證，最好還是養成自己關閉的習慣。如果一個文件在關閉后還對其進行操作會產生ValueError

F.flush()

#把緩沖區的內容寫入硬盤

F.fileno()

#返回一個長整型的”文件標簽“

F.isatty()

#文件是否是一個終端設備文件（unix系統中的）

F.tell()

#返回文件操作標記的當前位置，以文件的開頭為原點

F.next()

#返回下一行，并將文件操作標記位移到下一行。把一個file用于for ... in file這樣的語句時，就是調用next()函數來實現遍歷的。

F.seek(offset[,whence])

#將文件打操作標記移到offset的位置。這個offset一般是相對于文件的開頭來計算的，一般為正數。但如果提供了whence參數就不一定了，whence可以為0表示從頭開始計算，1表示以當前位置為原點計算。2表示以文件末尾為原點進行計算。需要注意，如果文件以a或a+的模式打開，每次進行寫操作時，文件操作標記會自動返回到文件末尾。

F.truncate([size])

#把文件裁成規定的大小，默認的是裁到當前文件操作標記的位置。如果size比文件的大小還要大，依據系統的不同可能是不改變文件，也可能是用0把文件補到相應的大小，也可能是以一些隨機的內容加上去。

posted on 2011-03-04 16:10 草原上的駱駝閱讀(898) 評論(0) 編輯收藏所屬分類: Python

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: python 判斷 null Python 連接 Mysql python的time和date處理 Python IO Python Mysql python 中文亂碼 Python 正則表達式 Python Beautiful Soup Python UUID Python Urllib2

大漠駝鈴

Python IO

1.open

2.讀文件

讀文本文件

讀二進制文件

讀取所有內容

讀固定字節

讀每行

3.寫文件

寫文本文件

寫二進制文件

追加寫文件

寫數據

寫入多行

導航

公告

常用鏈接

留言簿(11)

隨筆分類(214)

隨筆檔案(239)

文章分類(1)

文章檔案(1)

相冊

作品

搜索

積分與排名

最新評論

閱讀排行榜

評論排行榜