【问题标题】:Is there a way to crawl all facebook fan pages? [closed]有没有办法抓取所有 facebook 粉丝页面? [关闭]
【发布时间】:2010-04-02 05:23:38
【问题描述】:

有没有办法抓取所有 facebook 粉丝页面并收集一些信息?例如抓取 facebook 粉丝页面并保存他们的名字,或者有多少粉丝等? 或者至少,您是否暗示过如何做到这一点?

【问题讨论】:

标签: php facebook web-crawler


【解决方案1】:

编写一个爬虫。

【讨论】:

  • RE:Stephen:您能否更详细地解释一下您的回复?我不是最流利的程序员,但希望能够将指向乐队所有粉丝的个人资料的链接导出到 csv 文件中。您能解释一下如何解析“粉丝”分隔线并查看其来源吗?另外——怎么解析出粉丝,然后解析出下一页链接?
【解决方案2】:

首先选择一个包含所需页面类别的页面:

例如: http://www.facebook.com/pages/http://www.facebook.com/pages/?browse&ps=93

然后使用爬虫获取所有页面链接。

现在您可以使用提取的链接分别解析每个页面。

你可以使用simple html dom进行爬取。

【讨论】:

    【解决方案3】:

    下载并运行 websphinx jar。在 Starting URLs 中输入 http://www.facebook.com/pages/ 并选择子树作为 Crawl。不要忘记增加页面大小和页面超时值。线程数越高 (100-200) 越有可能成功爬取更多页面。

    【讨论】:

    • facebook.com/pages 列出“推荐页面”、“喜欢的页面”。我看不到获取指向其他页面的链接的方法。一种方法是抓取朋友喜欢的页面。有什么建议吗?
    猜你喜欢
    • 1970-01-01
    • 2013-04-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-04-03
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多