【问题标题】:need Adblockplus filter systemwide via /etc/hosts需要通过 /etc/hosts 在系统范围内过滤 Adblockplus
【发布时间】:2021-05-18 08:12:26
【问题描述】:

我正在抓取一些网站以获取他们在 python 中使用 selenium 的内容。我可以通过geckodriver 运行无头firefox 并将marionette 功能设置为True 并启用adblockplus 扩展,它运行良好。但是,firefox 的最新版本(截至 2021 年 3 月)不支持性能日志记录——这对于我的目的来说是必须的。所以我不得不改用chromedriver 和 Chromium。日志记录效果很好,但在无头模式下运行时 chromium 不支持浏览器扩展并引发错误。

所以我认为我一直在使用 chromedriver 和 Chromium,但没有 adblockplus 或任何其他广告拦截确实会损害我的运行时间,并且有一些叠加层在其他情况下不会出现。

如何找到并提取我的 adblockplus 浏览器扩展的过滤器列表,以便我可以使用其中的域名和我的 /etc/hosts 文件应用相同的过滤器,即将所有这些“坏”域发送到 0.0.0。 0.0

【问题讨论】:

    标签: python linux selenium adblock hosts-file


    【解决方案1】:

    如果您打开设置并单击高级。你会看到过滤器。每个过滤器都指向一个存储的 url。

    1.我之前链接的简单列表:https://easylist-downloads.adblockplus.org/easylist.txt 2. ABP过滤器https://easylist-downloads.adblockplus.org/abp-filters-anti-cv.txt

    【讨论】:

    • 我预计格式不会是纯文本,我准备为此编写一个脚本 - 我只需要知道信息是如何存储在 adblockplus 中的,因为他们很有动力总是有一个全面的清单,并经常朝着这个目标努力。感谢您的列表,但我已经遇到过它们 - 它们很好,但只是我可以从 adblockplus 获得的一部分 - 充其量
    • 嗯,有两个。我已经更新了回复
    • tnx @art_architect
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2017-12-12
    • 1970-01-01
    • 1970-01-01
    • 2016-08-14
    • 2018-07-08
    • 2022-11-12
    • 1970-01-01
    相关资源
    最近更新 更多