目錄
0x01 文章背景
0x02 使用python 刪除檔案
0x03 windows 文件系统关于长路径文件的相关定义
0x04 改造 python 程序,删除长路径文件
0x04 总结思考
0x05 参考资料
首頁 後端開發 Python教學 手把手使用 Python 刪除 Windows 下的長路徑文件

手把手使用 Python 刪除 Windows 下的長路徑文件

Apr 12, 2023 pm 01:31 PM
python windows root

0x01 文章背景

近期,筆者所在公司的某業務系統的儲存臨近極限,伺服器馬上就要跑不動了,由於該業務系統A包含多個子系統A1、A2、A3 . .. An,這些子系統的中間儲存檔案由於設計原因,都儲存在同一個父級目錄之內,唯一不同的是,不同子系統產生的檔案和資料夾的名字都以該子系統名稱開始。如A1子系統所產生的檔案命名方式均為A1xxxxxx, A2子系統所產生的檔名均為A2xxxxx。現在要刪除其中一些子系統的歷史文件,以釋放伺服器空間,幾十T的數據,存放在一起,手動刪除肯定不顯示,只能藉助程式自動化實現了,使用什麼呢?自然想到了python。其實單純刪文件這一需求我認為不值得長篇闊論,但是其中遇到了一些特殊有趣的問題和一些有意思的解決方案,所以想與諸位分享一下,比如windows系統下的超長文件刪除, 如從閱讀官方英文文件尋找解決方案等等,下面進入正題。

0x02 使用python 刪除檔案

使用python刪除檔案有很多方式,最直接也是最方便的方式就是呼叫內建函數:

  • os.remove ()  刪除檔案
  • os.rmdir() 刪除一個空白資料夾
  • shutil.rmtree() 刪除一個資料夾及該資料夾下所有內容(包括子目錄及檔案)

也就是,此問題的解決方案,核心就是圍繞上述三個函數的處理。轉到我們遇到的問題,業務系統A包含多個子系統A1、A2、A3 ... An,這些子系統的中間儲存檔案由於設計原因,都儲存在同一個父級目錄之內,唯一不同的是,不同子系統所產生的檔案和資料夾的名字都以該子系統名稱開始。如A1子系統產生的文件命名方式均為A1xxxxxx, A2子系統產生的文件名均為A2xxxxx,現在的目的就是要在該刪除指定子系統所產生的文件,保留其他子系統的文件。

將需求拆解下,實際上就是解決下列4個問題:

1.怎麼刪除一個檔案?

2.怎麼辨識一個檔案或資料夾是某個子系統產生的?

3.如何判斷一個路徑是檔案還是目錄?

4.如何定位所有指定的子系統所產生的檔案和資料夾?

對於問題1, 在本節開始就闡述過,使用 python 的內建函數進行刪除即可:

os.remove("path") # 删除指定文件
os.rmdir("path") # 删除一个空文件夹
shutil.rmtree("path") #删除一个文件夹及该文件夹下所有内容(包括子目录及文件)
登入後複製

對於問題2,由於特定子系統產生的文件和資料夾的命名方式都是固定的模式,如A1子系統產生的檔名均為A1xxxxx,故可透過關鍵字匹配的方式來辨識。一個可能的方式為:

if keywords in filepath: # 如果文件名包含关键字keywords
os.remove(filepath) # 删除文件
else:
pass
登入後複製

對於問題3,由於刪除目錄和刪除文件的方式不一致,故需要在刪除前判斷一個路徑是目錄還是文件,根據其類型選擇合適的刪除方式,這個在python 中可以使用**os.path.isdir()**之類的函數進行判斷,主要是下列函數:

os.path.isdir("path") # 返回true则为目录,false则为文件
os.path.isfile("path") # 返回true则为文件,false则为目录
登入後複製

對於問題4,如何定位所有要刪除的文件,這個問題實際上就是一個指定目錄檔案遍歷的問題,也就是如何遍歷一個指定目錄的所有資料夾及檔案。對於這個問題,一般有兩種解決方案,一是深度優先遍歷方式,一是廣度優先遍歷方式,兩種方式在本例中效率是一致的,因為我們最終都要遍歷所有的文件。另外,幸運的是,python實在是過於強大,其內建的函數已經幫助我們實現了一個廣度優先目錄遍歷方法,及 os.walk("path") 方法,該方法就是遍歷 path 目錄下的所有文件及資料夾,典型的用法如下:

import os

path = "C:\A\"

for root, dirs, files in os.walk(path):
print(root)
print(dirs)
print(files)
登入後複製

上例中,root 代表目前遍歷到的路徑,dirs 表示目前路徑下所有的子目錄, files 表示目前路徑下的所有子檔案。透過這種方式就能全部遍歷指定目錄了。

問題都分解開了,以下將問題組合一下就完成程式碼實作.

最終的程式碼實作為:

import os
import shutil

path = "C:\A\"
keyword = "A1"

for root, dirs, files in os.walk(path):
for dir in dirs:
if keyword in dir:
rmpath = os.path.join(root, dir)
print("删除文件夹: %s" % rmpath)
shutil.rmtree(rmpath)
for file in files:
if keyword in file:
rmpath = os.path.join(root, file)
print("删除文件: %s" % rmpath)
os.remove(rmpath)
登入後複製

即透過廣度優先方式(os. walk())遍歷指定目錄,逐一判斷目錄下所有子目錄和檔案是否符合關鍵字條件,滿足就刪除。

運行效果為:

手把手使用 Python 刪除 Windows 下的長路徑文件

看似需求到此基本上就很好的解決了,但是實際測試中發現有的很深的目錄卻沒有刪除,刪除目錄時報了一個錯,錯誤描述如下:

Unexpected error: (< type 'exceptions.WindowsError'>, WindowsError(3, 'The system cannot find the path specified'), < traceback object at 0x0000000002714F88>)
登入後複製

大致意思就是python找不到这个路径,可是为什么呢?为此,我继续进行一番资料查询,后来大致定位了是由于文件路径过长导致的,是由于windows系统用户态的默认路径长度不能超过256个字节导致的。但是官方说256个字节是最长,但为何能创建超过256的呢,所以既然能创建,那就一定能删除,但是需要一些方法,经过一番学习,找到了好几种方法,下面介绍其中一种最为实用的方法,另外几个比如使用压缩软件压缩后删除(百度知道的结果)适合手动但不适合编程解决。这个方法在下一节中继续讲述。

0x03 windows 文件系统关于长路径文件的相关定义

为解决windows下的长文件删除的问题,最为权威的资料莫过于windows官方的描述,我阅读了微软关于文件名长度的这一块的定义及说明,找到解决方案,微软的原文如下:

手把手使用 Python 刪除 Windows 下的長路徑文件

关键意思如下:

1.Windows API 提供的文件路径理论上最长是 32767 个字节,普通状态下给用户使用是不超过256个字符,说是为了使用户操作更加方便。这里不得不吐槽一下了,确实操作方便了,但是方便的同时也可能带来不便,明明定义了32767这么长的字节,只给用256,未免太抠搜了一点

2.用户如果想要打破这个长度限制,可以通过一个特殊方式告诉windows系统自己想要使用超长文件,这个特殊的方式就是在绝对路径前加上** "?" **字符串。

3.这篇文档后面还有描述在windows10以后如何通过注册表的方式接触文件名长度限制,这里就没有截图了,因为不通用,win7怎么办呢?有兴趣的同学可以查看其原文链接阅读:https://docs.microsoft.com/en-US/windows/win32/fileio/maximum-file-path-limitation?tabs=cmd

好了,看到这,解决方法呼之欲出,其实简单得不能太简单,直接在绝对路径前加上一个"?"即可:

# 获取目标路径的绝对路径,并在路径前加上\?,
# 以解除windows的文件长度限制
path = '\\?\' + os.path.abspath(path)
登入後複製

0x04 改造 python 程序,删除长路径文件

根据上一节,对python程序进一步进行改造,加入windows长文件名限制解除,最后的完美删除工具就成型了:

import os
import shutil

path = "C:\A\"
keyword = "A1"

# 获取目标路径的绝对路径,并在路径前加上\?,
# 以解除windows的文件长度限制
path = '\\?\' + os.path.abspath(path)

for root, dirs, files in os.walk(path):
for dir in dirs:
if keyword in dir:
rmpath = os.path.join(root, dir)
print("删除文件夹: %s" % rmpath)
shutil.rmtree(rmpath)
for file in files:
if keyword in file:
rmpath = os.path.join(root, file)
print("删除文件: %s" % rmpath)
os.remove(rmpath)
登入後複製

虽然代码很短,只添加了一行,但是这一行,却完成了一个超级核心的任务,真可谓是灵魂一行啊,最后该工具中如在生产环境中发挥了其出色的作用,使服务器继续运转如飞了。

0x04 总结思考

啰嗦的话就不多说了,说几点思考 :

1.遇到问题将问题进行分解,拆分成一个个小问题逐步击破 。

2.要善于阅读官方技术文档,有时候解决一个问题的核心可能很简单,代码可能也就一行两行,但是就是藏在某个角落,不仔细去阅读还真不一定找得出来 。

3.python是个好东西,要有将问题转化成使用python去解决的习惯,习惯成自然,python可能在工作中就发挥大作用了呢。

0x05 参考资料

1.https://docs.microsoft.com/en-US/windows/win32/fileio/maximum-file-path-limitation?tabs=cmd  

2.https://stackoverflow.com/questions/6996603/how-to-delete-a-file-or-folder-in

以上是手把手使用 Python 刪除 Windows 下的長路徑文件的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1666
14
CakePHP 教程
1425
52
Laravel 教程
1325
25
PHP教程
1273
29
C# 教程
1252
24
PHP和Python:解釋了不同的範例 PHP和Python:解釋了不同的範例 Apr 18, 2025 am 12:26 AM

PHP主要是過程式編程,但也支持面向對象編程(OOP);Python支持多種範式,包括OOP、函數式和過程式編程。 PHP適合web開發,Python適用於多種應用,如數據分析和機器學習。

在PHP和Python之間進行選擇:指南 在PHP和Python之間進行選擇:指南 Apr 18, 2025 am 12:24 AM

PHP適合網頁開發和快速原型開發,Python適用於數據科學和機器學習。 1.PHP用於動態網頁開發,語法簡單,適合快速開發。 2.Python語法簡潔,適用於多領域,庫生態系統強大。

PHP和Python:深入了解他們的歷史 PHP和Python:深入了解他們的歷史 Apr 18, 2025 am 12:25 AM

PHP起源於1994年,由RasmusLerdorf開發,最初用於跟踪網站訪問者,逐漸演變為服務器端腳本語言,廣泛應用於網頁開發。 Python由GuidovanRossum於1980年代末開發,1991年首次發布,強調代碼可讀性和簡潔性,適用於科學計算、數據分析等領域。

Golang vs. Python:性能和可伸縮性 Golang vs. Python:性能和可伸縮性 Apr 19, 2025 am 12:18 AM

Golang在性能和可擴展性方面優於Python。 1)Golang的編譯型特性和高效並發模型使其在高並發場景下表現出色。 2)Python作為解釋型語言,執行速度較慢,但通過工具如Cython可優化性能。

Python與C:學習曲線和易用性 Python與C:學習曲線和易用性 Apr 19, 2025 am 12:20 AM

Python更易學且易用,C 則更強大但複雜。 1.Python語法簡潔,適合初學者,動態類型和自動內存管理使其易用,但可能導致運行時錯誤。 2.C 提供低級控制和高級特性,適合高性能應用,但學習門檻高,需手動管理內存和類型安全。

laravel安裝代碼 laravel安裝代碼 Apr 18, 2025 pm 12:30 PM

要安裝 Laravel,需依序進行以下步驟:安裝 Composer(適用於 macOS/Linux 和 Windows)安裝 Laravel 安裝器創建新項目啟動服務訪問應用程序(網址:http://127.0.0.1:8000)設置數據庫連接(如果需要)

如何解決Laravel中復雜的BelongsToThrough關係問題?使用Composer可以! 如何解決Laravel中復雜的BelongsToThrough關係問題?使用Composer可以! Apr 17, 2025 pm 09:54 PM

在Laravel開發中,處理複雜的模型關係一直是個挑戰,特別是當涉及到多層級的BelongsToThrough關係時。最近,我在處理一個多級模型關係的項目中遇到了這個問題,傳統的HasManyThrough關係無法滿足需求,導致數據查詢變得複雜且低效。經過一番探索,我找到了staudenmeir/belongs-to-through這個庫,它通過Composer輕鬆安裝並解決了我的困擾。

Python vs.C:探索性能和效率 Python vs.C:探索性能和效率 Apr 18, 2025 am 12:20 AM

Python在開發效率上優於C ,但C 在執行性能上更高。 1.Python的簡潔語法和豐富庫提高開發效率。 2.C 的編譯型特性和硬件控制提升執行性能。選擇時需根據項目需求權衡開發速度與執行效率。

See all articles