檔案開啟方式
當我們用open()函數去開啟檔案的時候,有好幾種開啟的模式。
'r'->只讀
'w'->只寫,檔案已存在則清空,不存在則建立。
'a'->追加,寫到檔案結尾
'b'->二進位模式,例如開啟映像、音訊、word檔案。
'+'->更新(可讀可寫)
這個帶'+'號的有點難以理解,上代碼感受下。
with open('foo.txt', 'w+') as f: f.write('bar\n') f.seek(0) data = f.read()
可以看到,上面這段程式碼,它不但可以寫,還可以讀出來。注意要先定位到開頭,f.seek(0),不然讀出來的是空資料。
有些人可能會有迷惑,既然帶'+'號是可讀可寫,那'w+'跟'r+'有什麼不同。
那就是,
'w+'會清空,會建立(檔案已存在則清空,不存在則建立。)
'r+'不清空,不建立
不要用二進位模式開啟文字檔
先看下面程式碼的「詭異」現象。
假設在windows下,我有個f.txt文件,裡面的內容是下面這樣的。
hello world
程式碼一,
#with open('f.txt', 'r') as f: print f.readlines() with open('f.txt', 'rb') as f: print f.readlines()
##
['hello\n', 'world\n'] ['hello\r\n', 'world\r\n']
#
with open('f.txt', 'rb') as f: data = f.read() with open('f.txt', 'w') as f: f.write(data)
打開文件,變成了下面這樣,
hello^M world^M
首先,先理解換行符號'\n'跟回車符'\r'的概念。
'\n',換行符號(LF,Line-Feed ),指新的一行。
因為在不同系統下的換行標識是不一樣的。
windows->'\r\n' unix->'\n' mac->'\r'
這就是為什麼windows下的txt在linux開啟的時候行尾會有'^M'。
在python中,可以透過os.linesep來取得目前系統的換行標識。例如在windows下,os.linesep是'\r\n'。
有了上面這些理論依據,就可以解析本文開頭程式碼的「詭異」現象了。
程式碼一中,用文字模式開啟的文件,換行標識會被python處理成'\n',而用二進位模式開啟則原封不動。