【发布时间】:2011-06-11 20:03:48
【问题描述】:
我真的很想制作一个网站爬虫,它可以访问一个网站,扫描它的链接,将链接放入数据库并移动到另一个网站。我找到了一个网站,但代码确实有问题。如果你见过这样的东西或者你自己写过一篇。
【问题讨论】:
-
您要抓取多少个网站?除非您在服务器上生成多个 PHP 进程,否则您将遇到麻烦。 PHP 是单线程的,你不会高效地抓取页面。
-
please post the code, not the website!我强烈反对/不同意这一点,该网站将比预先编写的代码具有更大的用途,也供将来参考。 -
还有其他更高效的语言吗?我只想要一个网络爬虫
-
您会在 Perl 区域找到更多现成的爬虫。 WWW::Mechanize 浮现在脑海中。
-
乞讨无济于事,要有尊严。
标签: php web-crawler