【问题标题】:Get around API authentication and keys (like Facebook and Twitter) [closed]绕过 API 身份验证和密钥(如 Facebook 和 Twitter)[关闭]
【发布时间】:2014-02-20 00:10:36
【问题描述】:

我正在尝试用 Python 制作一种机器人,扫描我选择的互联网上的一些信息。问题是 Facebook 和 Twitter 等一些网站在每次使用时都需要 API 要求的密钥。 例如,如何在没有奇怪键的情况下找到 Twitter 的研究结果来验证我在 Python 中的请求?有可能吗?

【问题讨论】:

    标签: python facebook api twitter


    【解决方案1】:

    如果您不想为每个 API 进行身份验证,那么采取的方法是 scrape。基本上,您将下载 HTML 格式的 twitter search results 并解析该 HTML 文件。如果您查看 HTML 文件(firefox 中的control + U),您可以看到推文文本包含在此元素中:

    <p class="js-tweet-text tweet-text">
    

    您将无法收集尽可能多的数据,但将大部分匿名收集(没有密钥/身份验证)。要收集更多数据,您可以使用在网站 HTML 中找到的链接(即 下一页抓取

    这里有一些关于 python 抓取的阅读材料:link

    除了lxmlBeautifulSoup 是一个强大且流行的用于抓取和解析 HTML 的库。

    【讨论】:

      猜你喜欢
      • 2018-03-21
      • 2011-07-25
      • 1970-01-01
      • 1970-01-01
      • 2013-07-21
      • 2012-07-06
      • 2021-01-22
      • 2020-09-20
      相关资源
      最近更新 更多