首頁 後端開發 Python教學 總結 Python十大常用文件操作

總結 Python十大常用文件操作

Dec 28, 2020 pm 05:45 PM
python

Python教學介紹十大常用檔案操作,乾貨滿滿~~

總結 Python十大常用文件操作

推薦(免費):Python教程(視頻)

日常對於批量處理文件的需求非常多,用Python寫腳本可以非常方便地實現,但在這過程中難免會和文件打交道,第一次做會有很多文件的操作無從下手,只能找度娘。

本篇東哥整理了10個Python中最常用到的文件操作,無論是批次或讀取文件都會用到,相信這個梳理會有所幫助。

1. 顯示目前目錄

當我們想知道目前的工作目錄是什麼的時候,我們可以簡單地使用os模組的getcwd()功能,或使用pathlibcwd(),如下所示。

>>> # 第一种方法:显示当前目录
... import os
... print("当前工作目录:", os.getcwd())
... 
Current Work Directory: /Users/ycui1/PycharmProjects/Medium_Python_Tutorials

>>> # 第二种方法:或者我们也可以使用 pathlib
... from pathlib import Path
... print("当前工作目录:", Path.cwd())
... 
Current Work Directory: /Users/ycui1/PycharmProjects/Medium_Python_Tutorials
登入後複製
如果使用的是舊版的Python(<3.4),則必須使用該os模組。

2. 建立一個新目錄

要建立目錄,可以使用os模組的mkdir()功能。函數將在指定的路徑下建立目錄,如果僅使用目錄名稱,則會在目前目錄中建立資料夾,即絕對路徑和相對路徑的概念。

>>> # 在当前文件夹创建新目录
... os.mkdir("test_folder")
... print("目录是否存在:", os.path.exists("test_folder"))
... 
目录是否存在: True
>>> # 在特定文件夹创建新目录
... os.mkdir('/Users/ycui1/PycharmProjects/tmp_folder')
... print("目录是否存在:", os.path.exists('/Users/ycui1/PycharmProjects/tmp_folder'))
... 
目录是否存在: True<p>但是,如果想要建立一個多層級的目錄,例如資料夾中下的資料夾),則需要使用該<code>makedirs()</code>功能。 </p>
<pre class="brush:php;toolbar:false">>>> # 创建包含子目录的目录
... os.makedirs('tmp_level0/tmp_level1')
... print("目录是否存在:", os.path.exists("tmp_level0/tmp_level1"))
... 
Is the directory there: True
登入後複製

如果使用最新版本的Python(≥3.4),則可以考慮利用pathlib模組建立新目錄。它不僅可以建立子目錄,而且可以處理路徑中所有遺失的目錄。

# 使用 pathlib
from pathlib import Path
Path("test_folder").mkdir(parents=True, exist_ok=True)
登入後複製

需要注意一個問題,如果嘗試多次執行上述某些程式碼,可能會遇到問題「無法建立已經存在的新目錄」。我們可以將exist_ok參設為True來處理此問題(預設值False值將阻止我們建立目錄)。

>>> # 使用 pathlib
... from pathlib import Path
... Path("test_folder").mkdir(parents=True, exist_ok=False)
... 
Traceback (most recent call last):
  File "<input>", line 3, in <module>
  File "/Users/ycui1/.conda/envs/Medium/lib/python3.8/pathlib.py", line 1284, in mkdir
    self._accessor.mkdir(self, mode)
FileExistsError: [Errno 17] File exists: 'test_folder'
登入後複製

3. 刪除目錄和檔案

完成對某些檔案或資料夾的操作後,我們可能想要刪除它。為此,我們可以使用os模組中的remove()函數來刪除檔案。如果要刪除資料夾,我們應該改用rmdir()

>>> # 删除一个文件
... print(f"* 删除文件前 {os.path.isfile('tmp.txt')}")
... os.remove('tmp.txt')
... print(f"* 删除文件后 {os.path.exists('tmp.txt')}")
... 
* 删除文件前 True
* 删除文件后 False
>>> # 删除一个文件夹
... print(f"* 删除文件夹前 {os.path.isdir('tmp_folder')}")
... os.rmdir('tmp_folder')
... print(f"* 删除文件夹后 {os.path.exists('tmp_folder')}")
... 
* 删除文件夹前 True
* 删除文件夹后 False
登入後複製

如果使用pathlib模組,可以使用unlink()方法,而刪除目錄可以使用rmdir()方法。請注意,這兩種方法都是Path物件的實例方法。

4. 取得檔案清單

當我們分析某個工作或機器學習項目進行資料處理時,需要取得特定目錄中的檔案清單。

通常,檔案名稱具有匹配的模式。假設我們要找目錄中的所有.txt文件,可使用Path物件的方法glob()來實作。 glob()方法建立了一個生成器,讓我們可以進行迭代。

>>> txt_files = list(Path('.').glob("*.txt"))
... print("Txt files:", txt_files)
... 
Txt files: [PosixPath('hello_world.txt'), PosixPath('hello.txt')]
登入後複製

另外,直接使用glob模組也很方便,如下所示,透過建立可以使用的檔案名稱列表,它具有相似的功能。在大多數情況下,例如文件讀取和寫入,兩者都可以使用。

>>> from glob import glob
... files = list(glob('h*'))
... print("以h开头的文件:", files)
... 
Files starting with h: ['hello_world.txt', 'hello.txt']
登入後複製

5. 移動和複製文件

移動文件

常規文件管理任務之一是移動和複製文件。在Python中,這些工作可以非常輕鬆地完成。要移動文件,只需將其舊目錄替換為目標目錄即可重命名該文件。假設我們需要將所有.txt檔案移到另一個資料夾,下面用Path#來實作。

>>> target_folder = Path("目标文件")
... target_folder.mkdir(parents=True,exist_ok=True)
... source_folder = Path('.')
... 
... txt_files = source_folder.glob('*.txt')
... for txt_file in txt_files:
...     filename = txt_file.name
...     target_path = target_folder.joinpath(filename)
...     print(f"** 移动文件 {filename}")
...     print("目标文件存在:", target_path.exists())
...     txt_file.rename(target_path)
...     print("目标文件存在:", target_path.exists(), '\n')
... 
** 移动文件 hello_world.txt
目标文件存在: False
目标文件存在: True 

** 移动文件 hello.txt
目标文件存在: False
目标文件存在: True
登入後複製

複製檔案

我們可以利用_shutil_模組中可用的功能,_shutil_模組是標準函式庫中另一個用於檔案操作的有用模組。我們可以copy()透過將原始檔案和目標檔案指定為字串來在模組中使用該函數。一個簡單的例子如下。當然,您可以將copy()函數與glob()函數結合使用,以處理具有相同模式的一堆檔案。

>>> import shutil
... 
... source_file = "target_folder/hello.txt"
... target_file = "hello2.txt"
... target_file_path = Path(target_file)
... print("* 复制前,文件存在:", target_file_path.exists())
... shutil.copy(source_file, target_file)
... print("* 复制后,文件存在:", target_file_path.exists())
... 
* 复制前,文件存在: False
* 复制后,文件存在: True
登入後複製

6. 檢查目錄/檔案

上面的範例中一直在使用exists()方法來檢查是否有特定路徑。如果存在,返回True;如果不存在,則傳回False。此功能在ospathlib模組中均可用,各自的用法如下。

# os 模块中 exists() 用法
os.path.exists('path_to_check')

# pathlib 模块中 exists() 用法
Path('directory_path').exists()
登入後複製

使用pathlib,我們也可以檢查路徑是目錄還是檔案。

# 检查路径是否是目录
os.path.isdir('需要检查的路径')
Path('需要检查的路径').is_dir()

# 检查路径是否是文件
os.path.isfile('需要检查的路径')
Path('需要检查的路径').is_file()
登入後複製

7. 取得檔案資訊

檔案名稱

處理檔案時,許多情況下都需要擷取檔案名稱。使用Path非常簡單,可以在Path物件上查看name屬性path.name。如果不想帶後綴,可以查看stem屬性path.stem

for py_file in Path().glob('c*.py'):
...     print('Name with extension:', py_file.name)
...     print('Name only:', py_file.stem)
... 
带文件后缀: closures.py
只有文件名: closures
带文件后缀: counter.py
只有文件名: counter
带文件后缀: context_management.py
只有文件名: context_management
登入後複製

檔案後綴

如果想单独提取文件的后缀,可查看Path对象的suffix属性。

>>> file_path = Path('closures.py')
... print("文件后缀:", file_path.suffix)
... 
File Extension: .py
登入後複製

文件更多信息

如果要获取有关文件的更多信息,例如文件大小和修改时间,则可以使用该stat()方法,该方法和os.stat()一样。

>>> # 路径 path 对象
... current_file_path = Path('iterable_usages.py')
... file_stat = current_file_path.stat()
... 
>>> # 获取文件大小:
... print("文件大小(Bytes):", file_stat.st_size)
文件大小(Bytes): 3531
>>> # 获取最近访问时间
... print("最近访问时间:", file_stat.st_atime)
最近访问时间: 1595435202.310935
>>> # 获取最近修改时间
... print("最近修改时间:", file_stat.st_mtime)
最近修改时间: 1594127561.3204417
登入後複製

8. 读取文件

最重要的文件操作之一就是从文件中读取数据。读取文件,最常规的方法是使用内置open()函数创建文件对象。默认情况下,该函数将以读取模式打开文件,并将文件中的数据视为文本。

>>> # 读取所有的文本
... with open("hello2.txt", 'r') as file:
...     print(file.read())
... 
Hello World!
Hello Python!
>>> # 逐行的读取
... with open("hello2.txt", 'r') as file:
...     for i, line in enumerate(file, 1):
...         print(f"* 读取行 #{i}: {line}") 
... 
* 读取行 #1: Hello World!

* 读取行 #2: Hello Python!
登入後複製

如果文件中没有太多数据,则可以使用该read()方法一次读取所有内容。但如果文件很大,则应考虑使用生成器,生成器可以逐行处理数据。

默认将文件内容视为文本。如果要使用二进制文件,则应明确指定用r还是rb

另一个棘手的问题是文件的编码。在正常情况下,open()处理编码使用utf-8编码,如果要使用其他编码处理文件,应设置encoding参数。

9. 写入文件

仍然使用open()函数,将模式改为wa打开文件来创建文件对象。w模式下会覆盖旧数据写入新数据,a模式下可在原有数据基础上增加新数据。

>>> # 向文件中写入新数据
... with open("hello3.txt", 'w') as file:
...     text_to_write = "Hello Files From Writing"
...     file.write(text_to_write)
... 
>>> # 增加一些数据
... with open("hello3.txt", 'a') as file:
...     text_to_write = "\nHello Files From Appending"
...     file.write(text_to_write)
... 
>>> # 检查文件数据是否正确
... with open("hello3.txt") as file:
...     print(file.read())
... 
Hello Files From Writing
Hello Files From Appending
登入後複製

上面每次打开文件时都使用with语句。

with语句为我们创建了一个处理文件的上下文,当我们完成文件操作后,它可以关闭文件对象。这点很重要,如果我们不及时关闭打开的文件对象,它很有可能会被损坏。

10. 压缩和解压缩文件

压缩文件

zipfile模块提供了文件压缩的功能。使用ZipFile()函数创建一个zip文件对象,类似于我们对open()函数所做的操作,两者都涉及创建由上下文管理器管理的文件对象。

>>> from zipfile import ZipFile
... 
... # 创建压缩文件
... with ZipFile('text_files.zip', 'w') as file:
...     for txt_file in Path().glob('*.txt'):
...         print(f"*添加文件: {txt_file.name} 到压缩文件")
...         file.write(txt_file)
... 
*添加文件: hello3.txt 到压缩文件
*添加文件: hello2.txt 到压缩文件
登入後複製

解压缩文件

>>> # 解压缩文件
... with ZipFile('text_files.zip') as zip_file:
...     zip_file.printdir()
...     zip_file.extractall()
... 
File Name                                             Modified             Size
hello3.txt                                     2020-07-30 20:29:50           51
hello2.txt                                     2020-07-30 18:29:52           26
登入後複製

结论

以上就是整理的Python常用文件操作,全部使用内置函数实现。当然,也可以借助比如pandas等库来完成一些操作。

以上是總結 Python十大常用文件操作的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1657
14
CakePHP 教程
1415
52
Laravel 教程
1309
25
PHP教程
1257
29
C# 教程
1230
24
PHP和Python:解釋了不同的範例 PHP和Python:解釋了不同的範例 Apr 18, 2025 am 12:26 AM

PHP主要是過程式編程,但也支持面向對象編程(OOP);Python支持多種範式,包括OOP、函數式和過程式編程。 PHP適合web開發,Python適用於多種應用,如數據分析和機器學習。

在PHP和Python之間進行選擇:指南 在PHP和Python之間進行選擇:指南 Apr 18, 2025 am 12:24 AM

PHP適合網頁開發和快速原型開發,Python適用於數據科學和機器學習。 1.PHP用於動態網頁開發,語法簡單,適合快速開發。 2.Python語法簡潔,適用於多領域,庫生態系統強大。

PHP和Python:深入了解他們的歷史 PHP和Python:深入了解他們的歷史 Apr 18, 2025 am 12:25 AM

PHP起源於1994年,由RasmusLerdorf開發,最初用於跟踪網站訪問者,逐漸演變為服務器端腳本語言,廣泛應用於網頁開發。 Python由GuidovanRossum於1980年代末開發,1991年首次發布,強調代碼可讀性和簡潔性,適用於科學計算、數據分析等領域。

Python vs. JavaScript:學習曲線和易用性 Python vs. JavaScript:學習曲線和易用性 Apr 16, 2025 am 12:12 AM

Python更適合初學者,學習曲線平緩,語法簡潔;JavaScript適合前端開發,學習曲線較陡,語法靈活。 1.Python語法直觀,適用於數據科學和後端開發。 2.JavaScript靈活,廣泛用於前端和服務器端編程。

sublime怎麼運行代碼python sublime怎麼運行代碼python Apr 16, 2025 am 08:48 AM

在 Sublime Text 中運行 Python 代碼,需先安裝 Python 插件,再創建 .py 文件並編寫代碼,最後按 Ctrl B 運行代碼,輸出會在控制台中顯示。

vs code 可以在 Windows 8 中運行嗎 vs code 可以在 Windows 8 中運行嗎 Apr 15, 2025 pm 07:24 PM

VS Code可以在Windows 8上運行,但體驗可能不佳。首先確保系統已更新到最新補丁,然後下載與系統架構匹配的VS Code安裝包,按照提示安裝。安裝後,注意某些擴展程序可能與Windows 8不兼容,需要尋找替代擴展或在虛擬機中使用更新的Windows系統。安裝必要的擴展,檢查是否正常工作。儘管VS Code在Windows 8上可行,但建議升級到更新的Windows系統以獲得更好的開發體驗和安全保障。

vscode在哪寫代碼 vscode在哪寫代碼 Apr 15, 2025 pm 09:54 PM

在 Visual Studio Code(VSCode)中編寫代碼簡單易行,只需安裝 VSCode、創建項目、選擇語言、創建文件、編寫代碼、保存並運行即可。 VSCode 的優點包括跨平台、免費開源、強大功能、擴展豐富,以及輕量快速。

notepad 怎麼運行python notepad 怎麼運行python Apr 16, 2025 pm 07:33 PM

在 Notepad 中運行 Python 代碼需要安裝 Python 可執行文件和 NppExec 插件。安裝 Python 並為其添加 PATH 後,在 NppExec 插件中配置命令為“python”、參數為“{CURRENT_DIRECTORY}{FILE_NAME}”,即可在 Notepad 中通過快捷鍵“F6”運行 Python 代碼。

See all articles