搜索子文件夹并构建特定文件类型的列表时,必须确保子文件夹变量指向正确的文件夹。以下代码片段演示了此问题:
<code class="python">for root, subFolder, files in os.walk(PATH): for item in files: if item.endswith(".txt"): fileNamePath = str(os.path.join(root, subFolder, item))</code>
此处,subFolder 变量包含子文件夹列表,而不是 ITEM 文件所在的文件夹。为了纠正这个问题,我们可以使用由 root 变量表示的 dirpath,因为它保存了正确的目录路径。这个修改后的代码片段解决了这个问题:
<code class="python">import os result = [os.path.join(dp, f) for dp, dn, filenames in os.walk(PATH) for f in filenames if os.path.splitext(f)[1] == '.txt']</code>
另一种优雅的方法是利用 glob 模块,它根据扩展名有效地选择文件:
<code class="python">from glob import glob result = [y for x in os.walk(PATH) for y in glob(os.path.join(x[0], '*.txt'))]</code>
Python 3.4 及更高版本提供基于 glob 的解决方案的生成器版本:
<code class="python">from itertools import chain result = (chain.from_iterable(glob(os.path.join(x[0], '*.txt')) for x in os.walk('.')))</code>
最后,对于 Python 3.4 ,使用 pathlib 模块的现代方法是:
<code class="python">from pathlib import Path result = list(Path(".").rglob("*.[tT][xX][tT]"))</code>
以上是如何在Python中高效地列出递归子文件夹中的文件?的详细内容。更多信息请关注PHP中文网其他相关文章!