【发布时间】:2014-07-01 04:48:17
【问题描述】:
我正在开发一个社交媒体聚合器,并且想知道是否有一种方法可以使用 Java 代码来抓取 FaceBook、Twitter 和其他社交媒体网站。我想从 Facebook 页面抓取特定数据。我是否需要 Facebook 的特定权限或任何其他要求?
【问题讨论】:
标签: java javascript facebook web-crawler
我正在开发一个社交媒体聚合器,并且想知道是否有一种方法可以使用 Java 代码来抓取 FaceBook、Twitter 和其他社交媒体网站。我想从 Facebook 页面抓取特定数据。我是否需要 Facebook 的特定权限或任何其他要求?
【问题讨论】:
标签: java javascript facebook web-crawler
技术上是的...#2 https://www.facebook.com/legal/terms
如果您是在 Java 中将其构建为机器人,那么我在使用 JS 和本地/远程网络服务器方面取得了更大的成功。虽然这在理论上更容易检测到
如果您将其构建为一个本质上自动化的网络浏览器,只要您限制自己的速率并添加一点随机等待,那么就没有很好的方法来检测它。
【讨论】:
是的,根据https://www.facebook.com/apps/site_scraping_tos_terms.php,如果您要抓取它们,您需要获得 Facebook 的书面许可。
【讨论】: