删除“文件 1”中包含“文件 2”列表中的一系列数字的行答案

【问题标题】：Remove lines in "file 1" which contains a series of numbers from list in "file 2"删除“文件 1”中包含“文件 2”列表中的一系列数字的行
【发布时间】：2025-12-27 15:05:12
【问题描述】：

我有两个 TXT 文件。第一个包含我需要下载的 10.000 个超链接。第二个包含我成功下载的一系列数字（文件名）。但是，有些文件没有下载。需要从“文件 1”中删除包含第二个文件中的一系列数字的超链接（行）的方法，所以我不会重新下载它们。需要带有超链接的干净文件 1，我需要再次下载，因为宏记录器会跳过它们。

示例文件 1：

https://www.shutterstock.com/download/confirm/70023262?id=70023262&size=huge_jpg&src=download_history
https://www.shutterstock.com/download/confirm/61707421?id=61707421&size=huge_jpg&src=download_history
https://www.shutterstock.com/download/confirm/72736375?id=72736375&size=vector_eps&src=download_history
https://www.shutterstock.com/download/confirm/12755167?id=12755167&size=vector_eps&src=download_history
https://www.shutterstock.com/download/confirm/75060223?id=75060223&size=huge_jpg&src=download_history

示例文件 2：

70023262
61707421
72736375

前 3 行下载正常，这 3 行需要从“文件 1”中删除。最后两行需要保留，因为我需要重新下载。

比较插件。但是如何复制添加的行，带+号的绿色？ Compare plugin

【问题讨论】：

这不是 Notepad++ 的工作，它看起来像一个编程问题。你试过什么？
比较插件。但是如何复制添加的行，带+号的绿色？比较插件。见图片“比较插件”
用您喜欢的脚本语言编写脚本。

标签： notepad++

【解决方案1】：

解决方案

在记事本++ 中，我将制表符编号与其余 3 列分开

    https://www.shutterstock.com/download/confirm/  218688439   ?id=218688439&size=huge_jpg&src=download_history
    https://www.shutterstock.com/download/confirm/  572805157   ?id=572805157&size=huge_jpg&src=download_history
    https://www.shutterstock.com/download/confirm/  68777392    ?id=68777392&size=huge_jpg&src=download_history
    https://www.shutterstock.com/download/confirm/  119794933   ?id=119794933&size=huge_jpg&src=download_history

在 Excel 中粘贴“文件 2”中数字列表顶部的 B 列。
在 a-c 列第 1 步的底部列表中粘贴 excel。
选择 B 列并在 Excel 菜单中选择数据/删除重复项，选择选项“扩展选择...”并在对话框中选择 B 列。那是。底部是其余的超链接，我需要合并列 a+b+c。

【讨论】：

【解决方案2】：

首先，您需要确保您拥有文件的副本。

为了通过 Excel 保存方式，我建议使用 Notepad++ 的解决方案。因此，假设您有一个带有一些 URL 记录的 file-1.txt 和一个较小的 file-2.txt，其 ID 如上面的问题所示。您需要为 file-1.txt 的所有记录添加书签，这些记录具有来自 file-2.txt 的子字符串。

请注意，文本文件的名称对于按如下所述的正确顺序进行处理很重要。

所以，请按照以下步骤操作（不要害怕，完成后很容易。）：

在记事本++中首次打开文件file-2.txt
选择file-2.txt的所有内容(Ctrl+A)
保存到剪贴板（Ctrl+C）
打开你的第二个文件file-1.txt
在file-1.txt 的末尾添加一个包含许多例如的新行两个文件中都不存在冒号 ::::::（或 %、@ 等），这就像两个文件之间的分隔符！
在 file-1.txt 的末尾添加剪贴板的内容 :::::: ( Ctrl+V )
回到现在的最开始file-1.txt(Ctrl+Pos1)
打开查找对话框（Ctrl+F）
选择标记选项卡
检查书签行选项
选择正则表达式搜索模式
查找内容：([0-9]{8,8})(?=(?s).*:::::.*?\1)
单击“全部标记”按钮

file-1.txt 的所有行以及位于行:::::: 之后的匹配子字符串（来自file-2.txt）都被添加到书签。

移动到:::::: 行并删除所有附加到文件末尾的行。最后，保存新状态和所有书签，或者在保存之前根据需要删除这些行：

搜索 > 书签 > 删除带书签的行

【讨论】：