Python os.walk() 访问所有文件夹而不是仅访问给定文件夹
我想使用一个简单的脚本来获取给定文件夹下的所有图像并比较它们/查找重复项。 当解决方案的第一步已经存在时,为什么还要发明轮子: Finding duplicate files and removing them 但它已经在第一步失败了,因为它访问了给定 USB 闪存驱动器上的所有文件夹。我剥离了所有散列的东西,我试图只获取文件列表,但即便如此,它也会永远持续并访问 USB 驱动器上的每个文件。 f... »
我想使用一个简单的脚本来获取给定文件夹下的所有图像并比较它们/查找重复项。 当解决方案的第一步已经存在时,为什么还要发明轮子: Finding duplicate files and removing them 但它已经在第一步失败了,因为它访问了给定 USB 闪存驱动器上的所有文件夹。我剥离了所有散列的东西,我试图只获取文件列表,但即便如此,它也会永远持续并访问 USB 驱动器上的每个文件。 f... »
-Root --A ---1,2 --B ---3 我正在尝试获取基于子目录的路径列表: [['Root/A/1','Root/A/2'],['Root/B/3']] 我尝试使用 os.walk,但无法正常工作。我可以在一个巨大的列表中获取所有文件的列表,但我无法根据子目录拆分这些文件 fullList = [] for root, dirs, files in os.walk(dir)... »
我有一个脚本: 循环遍历目录及其子目录中的所有文件 为文件列表中的每个唯一年份创建文件夹 将文件移动到它们各自的文件夹年份 根据时间戳 + 唯一编号重命名它们。 当我只运行第 1-3 部分时,它会将文件正确移动到文件夹中。 当我运行第 1-4 部分(包括 os.rename 部分)时,它会在将文件移回父目录后重命名文件。 开始文件结构: parent_folder --&g... »
您能解释一下为什么这个 Python 代码对 C 程序员有效吗? 这个习语用于递归检索文件列表 [os.path.join(dp, f) for dp, dn, fn in os.walk(os.path.expanduser(dir)) for f in fn] 我在Recursive os.listdir? 找到了这种风格。它没有标点符号或嵌套。我不明白为什么它会起作用。你能不能用我能... »
目前我正在开发一个项目,该项目将占用许多文件夹并将每个文件夹的内容合并到一个 pdf 中。这意味着每个文件夹将输出一个 pdf。我能够弄清楚如何使用 ReportLab 将我正在使用的文件合并为单个 pdf。现在我需要让它遍历每个文件夹并创建一个 pdf。到目前为止,我可以使用 os.walk 来运行我的测试目录,但它不会运行 pdf 脚本。 import glob import os imp... »
我有一个大型图像文件存储库(约 200 万个,.jpg),各个 id 分布在多个子目录中,我正在尝试在包含约 1,000 个子集的列表中查找和复制每个图像身份证。 我对 Python 还是很陌生,所以我的第一个想法是使用 os.walk 遍历每个文件的 1k 子集,以查看子集中是否有任何匹配 id。这至少在理论上是可行的,但在每秒 3-5 张图像的情况下,它似乎非常慢。一次查找一个 id 的所有文... »
我正在尝试遍历一个目录,搜索标题中包含“摘要”一词的所有文件。找到文件后,我想打开文件并检索存在“审核名称”和“已验证命中”的行。另外,检索了文件的目录路径。 我当前的代码搜索包含 3 个摘要文件的目录。查找目录路径和文件名,但仅从第一个文件中获取内容,并将该信息打印 3 次。 import os data_dir = "<dir with data>" for dirpath,... »
背景: 我的目标是在两个不同的文件夹(没有子文件夹)中找到重复的文件。为此,我使用以下 Python 脚本: ###Check ob alle Archive noch vorhanden oder ob Daten bei Check gelöscht wurden def listfiles(path): files = [] for dirName, subdirList... »
我有一个大目录,其中包含许多要排序的子目录,我正在尝试将特定文件类型复制到新文件夹,但我想保留原始子目录。 def copyFile(src, dest): try: shutil.copy(src,dest) except shutil.Error as e: print('Error: %s' % e) except IOError as e: print('Erro... »
我是一个脚本菜鸟,我被困在这个问题上。 我希望代码能做几件事: 要求用户输入要搜索的字符串。遍历给定文件路径的子目录。打开具有所列扩展名类型之一的文件。打开文件并搜索用户输入的字符串。将查询结果打印到文本文件。 该代码似乎需要一些时间才能运行,但什么也没有。 import os.path # Ask the user to enter string to search search_str =... »
我的目录和子目录中有一个 xlsx 文件列表,我想在某些条件下循环遍历此列表。现在看来该代码适用于主目录,但在打开子目录中的文件时遇到问题。我使用了 os.walk 方法,但我仍然收到错误消息“[Errno 2] 没有这样的文件或目录:”文档名称''' 。错误发生在代码的最后一段,即以 'for f in files: if f.endswith('.xlsx'): 开头的部分,依此类推。 如何解... »
我想从根目录导航到其中的所有其他目录并打印相同的内容。 这是我的代码: #!/usr/bin/python import os import fnmatch for root, dir, files in os.walk("."): print root print "" for items in fnmatch.filter(files, ... »
我在多个文件夹中有数百个小文本文件。每个文本文件中都有大量随机字母和符号,我的任务是查找某些信息,例如“HSBC”和“91274163”等。我对编码很陌生,而且我很挣扎,我没有很长的时间来完成这项工作,所以如果有人能提供帮助,我将不胜感激 import os FILENAMES=[] for root, dirs, files in os.walk(r"****MY PATH****"): ... »
我试图从特定文件夹的子文件夹中解压缩所有 .zip 和 .gz 文件。我想提取同一子文件夹中的所有文件。我尝试了下面的代码。但是我一直收到找不到文件的错误。 import zipfile,fnmatch,os rootPath = r"C:\boxes\am-2021\am-20216" pattern = '*.zip' for root, dirs, files in os.walk(ro... »
我正在使用os.walk 来识别通用源目录 (SRC) 中包含my_list 中的任何字符串的路径: SRC = '/User/dir_1/' my_list = ["dog", "cat", "mouse", "bird"] for dirpath, dirnames, filenames in os.walk(SRC): for folders in dirnames: ... »
我正在尝试从网络 PC 上的用户文件夹中删除所有 Outlook .ost 和 .nst 文件,并试图让它将删除的文件写入 CSV 文件。 我能够让它找到目录中的所有文件并将其写入 CSV 文件,但是当我尝试使用 os.remove 删除文件时,它似乎没有运行,我对其进行了哈希处理暂时。 我在 try 和 except 中添加了跳过正在使用的文件。 import os import sys sy... »
目录树如下所示:https://i.stack.imgur.com/nS9Vx.png 我的目标是输入会员 ID,程序应该分析所有日子的相关文件(activities.json)并将所有这些文件复制到一个新目录中。我也想重命名复制的文件(1,2,3,4 .....),但出现错误。 通常我不应该得到错误,因为复制的文件将具有不同的名称( 1 、 2 、 3 、 4 、 5 ......) 代码: i... »
我有一个文件夹,其中包含多个子文件夹,每个子文件夹包含我需要的 3-4 个文件。 我正在尝试遍历该文件夹并将每个子文件夹中的所有文件放入字典中,该字典稍后转储到 json 文件中。 到目前为止,我已经设法为单个文件执行此操作,json 文件如下所示: 这是代码: import os import json myDir = "\\\iads011n\\ContinuousTesting\\Dail... »
我正在尝试计算目录和子目录中的文件,它将用于许多我事先不知道的用户,所以我想在路径中使用“~”波浪号。但是当我执行以下操作时,python 什么也不返回: import os for root, dirs, files in os.walk("~/direcotry/sub_directory", topdown=True): for name in dirs: pri... »
我有一个包含多个文件夹的路径,每个文件夹都以“P”开头并以一个单独的数字(“P001”-“P104”)结尾。这些文件夹中的每一个都有两个子文件夹“subfolder1”和“subfolder2”,它们都包含“file_1.nii”和“file_2.nii”。我只想在子文件夹 1 中将“file_1.nii”重命名为“new_name.nii”,而不是在子文件夹 2 中。 此代码适用于重命名所有子文... »