python編程實(shí)現(xiàn)清理微信重復(fù)緩存文件
文 |某某白米飯
來(lái)源:Python 技術(shù)「ID: pythonall」
微信和 QQ 都有一個(gè)存放緩存文件的文件夾,微信在設(shè)置 --> 文件管理,QQ 在系統(tǒng)設(shè)置 --> 基本設(shè)置 --> 文件管理 --> 打卡個(gè)人文件中找到它,平時(shí)大家對(duì)這個(gè)文件夾關(guān)注度不高,這個(gè)文件夾慢慢的,偷偷的就占用了好幾十個(gè) G 的磁盤空間。下面就用 Python 寫個(gè)刪除重復(fù)文件的腳本清理這些空間。
glob 模塊
glob 模塊非常簡(jiǎn)單,就是用來(lái)查找文件和文件夾。查找文件只用到三個(gè)匹配符:"*", "?", "[]"。
通配符 功能
*:匹配0或多個(gè)字符
**:匹配所有文件,目錄,子目錄和子目錄里面的文件
?:匹配一個(gè)字符,這里與正則表達(dá)式? (正則?匹配前面表達(dá)式0次或者1次)
[]:匹配指定范圍內(nèi)的字符,如: [1-9]匹配1至9內(nèi)的字符
[!]:匹配不在指定范圍內(nèi)的字符
glob方法
這個(gè)方法返回所有匹配的文件路徑列表
# 當(dāng)前路徑下所有 py 文件
for fname in glob.glob("**/*.py",recursive=True):
print(fname)
# 當(dāng)前路徑文件 py 下 py 文件
for fname in glob.glob("py/*.py"):
print(fname)
# 單字通配符 ?,當(dāng)前路徑文件下以 Tem 開(kāi)頭后有一個(gè)字符文件夾
for fname in glob.glob("Tem?"):
print(fname)
# 范圍通配符[],當(dāng)前路徑文件下以 Tem 開(kāi)頭后一個(gè)數(shù)字符的 py 文件
for fname in glob.glob("Tem[0-9].py"):
print(fname)
# 范圍通配符[!],當(dāng)前路徑文件下以 Tem 開(kāi)頭后一個(gè)非數(shù)字符的 py 文件
for fname in glob.glob("Tem[!0-9].py"):
print(fname)
windowns下
file = glob.glob(r'D:\logs\*\*')
zlib.crc32
CRC32 算法概述 CRC 全稱 Cyclic Redundancy Check,又叫循環(huán)冗余校驗(yàn)。和 md5 碼一樣都是 hash 的。當(dāng)兩個(gè)文件內(nèi)容的 CRC32 相同的時(shí)候,這個(gè)文件也就是相同的。反之,兩個(gè)文件就是不同的文件。
def crc32(file_path): with open(file_path, 'rb') as fh: hash = 0 while True: s = fh.read(65536) if not s: break hash = zlib.crc32(s, hash) return "%08X" % (hash & 0xFFFFFFFF)
去重復(fù)
看到這里,想必都明白如何去重復(fù)文件了:1. 用 glob.glob 掃描所有文件,2. 把文件的 crc32 值放入字典中,3. 找到字典中已經(jīng)存在的 crc32 值的key,刪除當(dāng)前文件。
import os
import zlib
import glob
def scanning_floder(glob_path):
crc32Dict = {}
for fname in glob.glob(glob_path, recursive=True):
if os.path.isfile(fname):
crc = crc32(fname)
if crc in crc32Dict:
print('已經(jīng)存在文件:' + crc32Dict.get(crc))
print('重復(fù)文件:' + fname)
print('刪除文件:' + fname)
os.remove(fname)
print('')
else:
crc32Dict[crc] = fname
def crc32(file_path):
with open(file_path, 'rb') as f:
hash = 0
while True:
s = f.read(1024)
if not s:
break
hash = zlib.crc32(s, hash)
return "%08X" % (hash & 0xFFFFFFFF)
scanning_floder(r"C:\Users\xxxx\Documents\WeChat Files\xxxx\FileStorage\**\*")

總結(jié)
本篇介紹了 glob 模塊的用法和 crc32 值的計(jì)算,大家學(xué)廢了嗎?
更多關(guān)于python清理重復(fù)緩存文件的資料請(qǐng)關(guān)注本站其它相關(guān)文章!
版權(quán)聲明:本站文章來(lái)源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請(qǐng)保持原文完整并注明來(lái)源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非maisonbaluchon.cn所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來(lái)源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來(lái),僅供學(xué)習(xí)參考,不代表本站立場(chǎng),如有內(nèi)容涉嫌侵權(quán),請(qǐng)聯(lián)系alex-e#qq.com處理。
關(guān)注官方微信