深入解讀Python如何進(jìn)行文件讀寫
open
Python提供了非常方便的文件讀寫功能,其中open是讀寫文件的第一步,通過open讀寫文件的方式和把大象裝冰箱是一樣的
f = open("test.txt",'w') #第一步,把冰箱門(文件)打開
f.write("this is content") #第二步,把大象(文件內(nèi)容)裝進(jìn)去
f.close() #第三步,把冰箱門關(guān)上,否則大象可能會跑掉
open的定義方式為
file=open(path,mode='r',buffering=-1,encoding=None)
其中,
path為文件路徑mode為讀取模式,默認(rèn)為r,即只讀模式。buffering為緩沖區(qū),由于內(nèi)存的讀寫速度快于外設(shè),所以大部分情況不用設(shè),即不大于0。encoding為編碼方式- 最后,輸出的
file是一個(gè)文件對象。
其中,mode包括以下幾種
| r | r+ | w | w+ | a | a+ | |
|---|---|---|---|---|---|---|
| b | rb | rb+ | wb | wb+ | ab | ab+ |
其中,b表示二進(jìn)制,r表示讀,w表示寫,a表示追加。無論什么模式,有+則意味著可讀可寫。寫入一般會覆蓋原文件,追加則在原文件尾部開始寫。如果文件不存在,w, w+, a, a+, wb會創(chuàng)建新文件。
文件對象
通過open創(chuàng)建的文件對象,除了用于關(guān)閉文件的close之外,有兩組最常用的函數(shù),即代表讀寫的read和write,分別用于讀寫,其區(qū)別如下
| read | write | 讀寫整個(gè)文件 read(size)可讀取size大小的文件 |
| readline | 每次讀一行 由于write直接輸入字符串,故不必設(shè)置writeline |
|
| readlines | writelines | 前者按行讀取文件,并存入一個(gè)字符串列表 writelines將一個(gè)字符串列表的形式寫入文件 |
例如
>>> f = open('test.txt','w')
>>> f.writelines(['a','b','c\n','d'])
>>> f.close()
>>> f = open('test.txt','r')
>>> f.readlines()
['abc\n', 'd']#在寫lines的時(shí)候,并不會自動添加\n
>>> f.close()
根據(jù)我電腦的性能,讀取500M的txt就要超過1s,讀取2G的文件多半要報(bào)錯(cuò)。這個(gè)時(shí)候需要通過seek函數(shù)來指定偏移量,然后在偏移處的位置對文件進(jìn)行讀寫操作。其輸入為f.seek(offset,whence=0)
其中
offset為偏移量whence為偏移方式,為0時(shí)表示絕對定位;為1時(shí)表示相對定位;為2表示從末尾定位。
從seek的視角來看,open文件時(shí),如果用了w,則代表seek(0),如果用了a,則代表seek(0,2)。
通過tell可以返回當(dāng)前偏移量,相當(dāng)于seek的對偶函數(shù)。
在對文件操作結(jié)束后,需要使用f.close()將緩存中的字符串寫入硬盤;如果害怕發(fā)生意外,可以用f.flush()強(qiáng)制寫入。
此外,文件對象的成員變量如下
| name | mode | encoding | error | closed | buffer |
|---|---|---|---|---|---|
| 文件名 | 讀寫模式 | 編碼方式 | 錯(cuò)誤模式 | 是否已經(jīng)關(guān)閉 | 緩沖區(qū) |
此外還有三個(gè)判定函數(shù)
readable() |
writable() |
seekable |
|---|---|---|
| 是否可讀 | 是否可寫 | 可否指定偏移量 |
with … as表達(dá)式
在寫入文件時(shí),如果忘了close或者flush,那么可能還有一些數(shù)據(jù)留在內(nèi)存中,從而導(dǎo)致我們得到的文件是殘缺的。
with as表達(dá)式可以通過調(diào)用對象中的__enter__方法和__exit__方法,來更加智能地調(diào)用close,從而免除了忘寫close的麻煩。其調(diào)用方法為
with open('text.txt','w') as f:
f.write("12345")
查看file.py,其__exit__函數(shù)正是close:
def __enter__(self): return self def __exit__(self, type, value, traceback): self.close()
底層實(shí)現(xiàn):os.open
open是非常方便的函數(shù),但開銷也很大,畢竟直接返回了一個(gè)文件對象。相比之下,其底層實(shí)現(xiàn)os.open返回的是一個(gè)整型的文件ID,對于在速度上有要求的頻繁的文件讀寫操作,可以考慮使用。
os中,打開一個(gè)文件的方法為
fd = os.open(path, flags, mode=511, dir_fd=None)
其中,
path為文件路徑flags為打開標(biāo)志,例如os.O_RDONLY代表只讀、os.O_WRONLY代表只寫mode表示文件權(quán)限,例如777代表任何人可讀可寫可執(zhí)行;511代表文件創(chuàng)建者可讀可執(zhí)行,其他人只可讀,這屬于Linux的內(nèi)容,日后可專門在Linux里說。dir_fd表示相對路徑的規(guī)則,為自定義函數(shù),比較少用。- 最后,輸出的
fd是某個(gè)文件的標(biāo)識。
其中,mode的取值可見于deepin和windows的手冊,常用的標(biāo)志如下,多個(gè)標(biāo)志可通過|疊加,這一股濃郁的C風(fēng)確認(rèn)來自操作系統(tǒng)無疑了。
| os.open | open | os.open | open |
|---|---|---|---|
| os.O_RDONLY | ‘r' | os.O_WRONLY | ‘w' |
| os.O_RDWR | ‘r+' | os.O_APPEND | ‘a(chǎn)' |
| os.O_CREAT | 創(chuàng)建并打開 |
其中相關(guān)的函數(shù)還有:
os.fdopen(fd, mode, bufsize) |
通過fd創(chuàng)建一個(gè)文件對象,并返回這個(gè)文件對象 |
os.read(fd, n) |
從fd 中讀取最多 n 個(gè)字節(jié)并返回,如果fd對應(yīng)文件已達(dá)到結(jié)尾, 則返回空串。 |
os.write(fd, str) |
將str寫入fd,返回實(shí)際寫入的字符串長度 |
os.fsync(fd) |
強(qiáng)制將fd所對應(yīng)的文件寫入硬盤 |
os.close(fd) |
關(guān)閉fd |
os.dup(fd) |
復(fù)制fd |
os.dup2(fd, fd2) |
將fd1所對應(yīng)的文件復(fù)制給fd2 |
os.fstat(fd) |
返回fd的狀態(tài) |
os.ftruncate(fd, length) |
裁剪fd, length不大于文件尺寸 |
os.isatty(fd) |
如果fd已經(jīng)打開,同時(shí)與tty(-like)設(shè)備相連,則返回True, 否則False。 |
os.lseek(fd, pos, how) |
設(shè)置fd當(dāng)前位置為pos, how為修改方式,等同于前文中的whence |
到此這篇關(guān)于深入解讀Python如何進(jìn)行文件讀寫的文章就介紹到這了,更多相關(guān)Python 文件讀寫內(nèi)容請搜索本站以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持本站!
版權(quán)聲明:本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非maisonbaluchon.cn所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學(xué)習(xí)參考,不代表本站立場,如有內(nèi)容涉嫌侵權(quán),請聯(lián)系alex-e#qq.com處理。
關(guān)注官方微信