【发布时间】:2026-02-18 08:30:01
【问题描述】:
我想阻止抓取工具将我网站上的特定图片编入索引,但前提是它们早于特定日期。但是,爬虫不会停止对当前链接图片的页面进行索引。
我最初的方法是编写一个脚本,将图像的 URL 添加到“robots.txt”中,但我认为文件会变得很大,因为我们讨论了非常大量的潜在图像。
我的下一个想法是使用<meta name="robots" content="noimageindex"> 标签,但我认为这种方法容易出错,因为我可能忘记将此标签添加到我可能希望阻止爬虫索引图像的模板中。这也是多余的,爬虫会忽略所有图像。
我的问题是:如果条件(在我的情况下是日期)为真,您是否知道以编程方式强制爬虫不索引图像?还是我唯一的可能阻止爬虫索引整个页面?
【问题讨论】: