【发布时间】:2011-05-22 02:14:03
【问题描述】:
我正在用 PHP 编写一个爬虫脚本。我正在使用 PHP Simple HTML DOM Parser。
获得 HTML 后,我只需从每个页面中提取一些信息,并将这些信息汇总到我自己网站上的 HTML 页面中。
我无法理解如何继续。
感谢任何帮助。
已添加
我想提取一些帖子(如果与特定地理和主题相关)
【问题讨论】:
-
耶稣。你从哪里开始。你需要一些策略来做你想做的事情。例如,您可以使用包含一些您想要提取的东西的关键字文件,您可以实现一个列表,指示您想要提取的东西......很多方法可以给这只猫剥皮......跨度>
-
你到底想提取什么......是电子邮件地址吗?
标签: php html dom web-crawler aggregate