一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

腳本之家,腳本語言編程技術(shù)及教程分享平臺(tái)!
分類導(dǎo)航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務(wù)器之家 - 腳本之家 - Python - python實(shí)現(xiàn)自動(dòng)清理重復(fù)文件

python實(shí)現(xiàn)自動(dòng)清理重復(fù)文件

2020-08-25 00:51劉早起 Python

這篇文章主要介紹了python如何實(shí)現(xiàn)自動(dòng)清理重復(fù)文件,幫助大家更好的理解和學(xué)習(xí)python,感興趣的朋友可以了解下

前言

大家好,又到了Python辦公自動(dòng)化系列。

今天分享一個(gè)系統(tǒng)層面的自動(dòng)化案例:

「給定一個(gè)文件夾,使用Python檢查給定文件夾下有無文件重復(fù),若存在重復(fù)則刪除」

主要涉及的知識(shí)點(diǎn)有:

  • os模塊綜合應(yīng)用
  • glob模塊綜合應(yīng)用
  • 利用filecmp模塊比較兩個(gè)文件

步驟分析

該程序?qū)崿F(xiàn)的邏輯可以具化為:

遍歷獲取給定文件夾下的所有文件,然后通過嵌套循環(huán)兩兩比較文件是否相同,如果相同則刪除后者。

實(shí)現(xiàn)問題的關(guān)鍵就變成了?

如何判斷兩個(gè)文件是否相同?

在這里我們可以使用filecmp模塊,來看看官方的介紹文檔:

  • filecmp.cmp(f1, f2, shallow=True)
  • 比較名為f1和f2的文件,如果它們似乎相等則返回True,否則返回False
  • 如果shallow為真,那么具有相同os.stat()簽名的文件將會(huì)被認(rèn)為是相等的。否則,將比較文件的內(nèi)容。

所以可以這樣使用?

?
1
2
3
# 假設(shè)x和y兩個(gè)文件是相同的
print(filecmp.cmp(x, y))
# True

解決了這個(gè)問題,我們就可以開始寫代碼了!

Python實(shí)現(xiàn)

導(dǎo)入需要的庫并設(shè)置目標(biāo)文件夾路徑

?
1
2
3
4
5
import os
import glob
import filecmp
 
dir_path = r'C:\\xxxx'

接著遍歷獲取所有文件的絕對(duì)路徑,我們可以利用glob模塊的通配符結(jié)合recursive參數(shù)即可完成,框架如下:

?
1
2
for file in glob.glob(path + '/**/*', recursive=True):
  pass

由于遍歷獲取每一個(gè)文件或者文件夾后,需要判斷是否是文件,如果是文件則可能將絕對(duì)路徑存放到列表中,這里需要再完成兩個(gè)事情:

  1. 首先創(chuàng)建一個(gè)空列表,后面用list.append(i)添加文件路徑
  2. 接著利用os.path.isfile(i)判斷是否是文件,返回True則執(zhí)行添加元素的操作

具體代碼如下

?
1
2
3
4
5
file_lst = []
 
for i in glob.glob(dir_path + '/**/*', recursive=True):
  if os.path.isfile(i):
    file_lst.append(i)

上一步我們獲取了目標(biāo)文件夾下的所有文件路徑,接下來就可以嵌套遍歷這個(gè)路徑列表,其中filecmp.cmp進(jìn)行文件判斷,os.remove進(jìn)行文件刪除

?
1
2
3
4
5
for x in file_lst:
  for y in file_lst:
    if x != y:
      if filecmp.cmp(x, y):
        os.remove(y)

這里的代碼已經(jīng)實(shí)現(xiàn)了大致邏輯,但有一個(gè)細(xì)節(jié)需要考慮到:有可能循環(huán)到文件已經(jīng)被前面的判斷刪除了,導(dǎo)致os.remove(file)由于文件不存在而報(bào)錯(cuò)

因此,可以用os.path.exists對(duì)文件存在進(jìn)行判斷,如下所示:

?
1
2
3
4
5
for x in file_lst:
  for y in file_lst:
    if x != y and os.path.exists(x) and os.path.exists(y):
      if filecmp.cmp(x, y):
        os.remove(y)

這樣,一個(gè)簡易的文件去重小程序就完成了,完整代碼如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import os
import glob
import filecmp
 
dir_path = r'C:\xxxx'
 
file_lst = []
 
for i in glob.glob(dir_path + '/**/*', recursive=True):
  if os.path.isfile(i):
    file_lst.append(i)
 
for x in file_lst:
  for y in file_lst:
    if x != y and os.path.exists(x) and os.path.exists(y):
      if filecmp.cmp(x, y):
        os.remove(y)

寫在最后

通過本文的Python自動(dòng)化腳本制作過程,我們可以再次體會(huì)Python辦公自動(dòng)化的強(qiáng)大,同時(shí)本次實(shí)現(xiàn)的功能可以和之前自動(dòng)整理文件的腳本結(jié)合使用!

以上就是python實(shí)現(xiàn)自動(dòng)清理重復(fù)文件的詳細(xì)內(nèi)容,更多關(guān)于python清理重復(fù)文件的資料請(qǐng)關(guān)注服務(wù)器之家其它相關(guān)文章!

原文鏈接:https://cloud.tencent.com/developer/article/1683712

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 高h细节肉爽文办公室 | 国产最新精品视频 | 69日本xxxx| 特级淫片大乳女子高清视频 | ferr孕妇videos毛茸茸 | 成年人在线观看视频 | 奇米影视在线视频 | 青青青国产精品国产精品美女 | 国产99在线观看 | 精品国产自在天天线2019 | sss亚洲国产欧美一区二区 | 美女自插 | 天天操天天射天天爽 | 日韩欧美a | 9久热久爱免费精品视频在线观看 | s0e一923春菜花在线播放 | 午夜影院免费体验 | 小兰被扒开内裤露出p | 3d欧美人禽交 | pornohd老师18 | 男人狂躁女人gif动态图 | 国产视频99 | 2019中文字幕在线视频 | 亚洲精品在线网址 | tiny4k欧美极品在线 | 亚洲第一色网站 | 99久视频| 四虎网址 | 国产精品一区久久精品 | 波多野结衣中文字幕乱七八糟 | 亚洲va天堂va国产va久久 | 免费看一级大片 | 无限在线观看免费入口 | 小草高清视频免费直播 | 九九热在线观看视频 | 刺激一区仑乱 | 欧洲美女女同 | 91久久偷偷做嫩草影院免费 | 午夜亚洲| 91制片厂果冻传媒杨柳作品 | 91混血大战上海双胞胎 |