【发布时间】:2014-05-19 09:06:16
【问题描述】:
我正在为银行业的社交媒体框架做一个项目,作为其中的一部分,我试图从 twitter 收集包含某些关键字的所有推文。所以我必须自己编写一个爬虫从头开始,或者有任何可用的工具。如果我必须编写自己的爬虫,是否建议用 JAVA 编写?以及任何可以指导我如何开始编写爬虫的链接。我不想要代码,只需要关于指南如何编码。任何关于爬虫如何工作等的好链接也将非常有帮助。
【问题讨论】:
标签: java twitter web-crawler text-mining