【发布时间】:2011-10-14 11:56:34
【问题描述】:
我想生成我网站中链接到外部网站的所有网页的列表(包含 500 页及更多)。
在我开始尝试编写这个代码之前,我想知道是否存在现成的东西,这样我就不会白费力气。
如果您知道或使用过任何,请分享。
谢谢
【问题讨论】:
标签: html web-crawler
我想生成我网站中链接到外部网站的所有网页的列表(包含 500 页及更多)。
在我开始尝试编写这个代码之前,我想知道是否存在现成的东西,这样我就不会白费力气。
如果您知道或使用过任何,请分享。
谢谢
【问题讨论】:
标签: html web-crawler
对于链接检查,我使用Xenu's Link Sleuth。
【讨论】:
W3C link checker 将为您提供所有链接的列表,并告诉您哪些链接有效。废弃输出以仅显示外部链接应该很简单。
【讨论】:
您是否考虑过使用网站嗅探器?有很多免费工具可以浏览您的网站并列出您的网页。
希望这会有所帮助:)
【讨论】:
SEOMOZ Pro 帐户 - 注册 30 天免费试用,我们那里最好的网站爬虫 http://www.seomoz.org/freetrial
【讨论】:
最终,最简单的方法是在数据库中使用 SQL 查询,因此请确保在遇到类似问题时通过 SQL 检查它是否可行,然后再尝试查找外部程序。
感谢大家的建议。
【讨论】: