【问题标题】:Remove lines in "file 1" which contains a series of numbers from list in "file 2"删除“文件 1”中包含“文件 2”列表中的一系列数字的行
【发布时间】:2025-12-27 15:05:12
【问题描述】:

我有两个 TXT 文件。第一个包含我需要下载的 10.000 个超链接。第二个包含我成功下载的一系列数字(文件名)。但是,有些文件没有下载。需要从“文件 1”中删除包含第二个文件中的一系列数字的超链接(行)的方法,所以我不会重新下载它们。需要带有超链接的干净文件 1,我需要再次下载,因为宏记录器会跳过它们。

示例文件 1:

https://www.shutterstock.com/download/confirm/70023262?id=70023262&size=huge_jpg&src=download_history
https://www.shutterstock.com/download/confirm/61707421?id=61707421&size=huge_jpg&src=download_history
https://www.shutterstock.com/download/confirm/72736375?id=72736375&size=vector_eps&src=download_history
https://www.shutterstock.com/download/confirm/12755167?id=12755167&size=vector_eps&src=download_history
https://www.shutterstock.com/download/confirm/75060223?id=75060223&size=huge_jpg&src=download_history

示例文件 2:

70023262
61707421
72736375

前 3 行下载正常,这 3 行需要从“文件 1”中删除。最后两行需要保留,因为我需要重新下载。

比较插件。但是如何复制添加的行,带+号的绿色? Compare plugin

【问题讨论】:

  • 这不是 Notepad++ 的工作,它看起来像一个编程问题。你试过什么?
  • 比较插件。但是如何复制添加的行,带+号的绿色?比较插件。见图片“比较插件”
  • 用您喜欢的脚本语言编写脚本。

标签: notepad++


【解决方案1】:

解决方案

  1. 在记事本++ 中,我将制表符编号与其余 3 列分开
    https://www.shutterstock.com/download/confirm/  218688439   ?id=218688439&size=huge_jpg&src=download_history
    https://www.shutterstock.com/download/confirm/  572805157   ?id=572805157&size=huge_jpg&src=download_history
    https://www.shutterstock.com/download/confirm/  68777392    ?id=68777392&size=huge_jpg&src=download_history
    https://www.shutterstock.com/download/confirm/  119794933   ?id=119794933&size=huge_jpg&src=download_history
  1. 在 Excel 中粘贴“文件 2”中数字列表顶部的 B 列。
  2. 在 a-c 列第 1 步的底部列表中粘贴 excel。
  3. 选择 B 列并在 Excel 菜单中选择数据/删除重复项,选择选项“扩展选择...”并在对话框中选择 B 列。那是。底部是其余的超链接,我需要合并列 a+b+c。

【讨论】:

    【解决方案2】:

    首先,您需要确保您拥有文件的副本。

    为了通过 Excel 保存方式,我建议使用 Notepad++ 的解决方案。因此,假设您有一个带有一些 URL 记录的 file-1.txt 和一个较小的 file-2.txt,其 ID 如上面的问题所示。您需要为 file-1.txt 的所有记录添加书签,这些记录具有来自 file-2.txt 的子字符串。

    请注意,文本文件的名称对于按如下所述的正确顺序进行处理很重要。

    所以,请按照以下步骤操作(不要害怕,完成后很容易。):

    • 在记事本++中首次打开文件file-2.txt
    • 选择file-2.txt的所有内容(Ctrl+A)
    • 保存到剪贴板(Ctrl+C
    • 打开你的第二个文件file-1.txt
    • file-1.txt 的末尾添加一个包含许多例如的新行两个文件中都不存在冒号 ::::::(或 %、@ 等),这就像两个文件之间的分隔符!
    • file-1.txt 的末尾添加剪贴板的内容 :::::: ( Ctrl+V )
    • 回到现在的最开始file-1.txt(Ctrl+Pos1)
    • 打开查找对话框(Ctrl+F
    • 选择标记选项卡
    • 检查书签行选项
    • 选择正则表达式搜索模式
    • 查找内容:([0-9]{8,8})(?=(?s).*:::::.*?\1)
    • 单击“全部标记”按钮

    file-1.txt 的所有行以及位于行:::::: 之后的匹配子字符串(来自file-2.txt)都被添加到书签。

    移动到:::::: 行并删除所有附加到文件末尾的行。最后,保存新状态和所有书签,或者在保存之前根据需要删除这些行:

    搜索 > 书签 > 删除带书签的行

    【讨论】:

      最近更新 更多