Facebook 页面爬取

【问题标题】：FaceBook Page CrawlingFacebook 页面爬取
【发布时间】：2014-07-01 04:48:17
【问题描述】：

我正在开发一个社交媒体聚合器，并且想知道是否有一种方法可以使用 Java 代码来抓取 FaceBook、Twitter 和其他社交媒体网站。我想从 Facebook 页面抓取特定数据。我是否需要 Facebook 的特定权限或任何其他要求？

【问题讨论】：

标签： java javascript facebook web-crawler

【解决方案1】：

技术上是的...#2 https://www.facebook.com/legal/terms

如果您是在 Java 中将其构建为机器人，那么我在使用 JS 和本地/远程网络服务器方面取得了更大的成功。虽然这在理论上更容易检测到

如果您将其构建为一个本质上自动化的网络浏览器，只要您限制自己的速率并添加一点随机等待，那么就没有很好的方法来检测它。

【讨论】：

谢谢，请问有JS代码和本地服务器吗？会呈现有用的。
你能分享你的爬虫吗？
github.com/vivekpatani/ai-ml-projects-data-science/tree/master/… 我们正在开发一个更高效的新版本。会及时通知您，我们的目标是下个月准备好。 @kuhaku

【解决方案2】：

是的，根据https://www.facebook.com/apps/site_scraping_tos_terms.php，如果您要抓取它们，您需要获得 Facebook 的书面许可。

【讨论】：

猜你喜欢

1970-01-01
1970-01-01
1970-01-01
1970-01-01
1970-01-01
2021-09-13
2018-02-11
1970-01-01

相关资源

下载 2021-06-06
下载 2022-12-28
下载 2022-12-13

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode