【问题标题】:How to get Instagram image details如何获取 Instagram 图片详细信息
【发布时间】:2016-11-29 23:19:19
【问题描述】:

我正在开发一个应用程序,通过使用 selenium 和 python 从 Instagram 获取图像详细信息。

driver.execute_script(SCROLL_TOP)
driver.execute_script(SCROLL_BOTTOM)

结果中,所有发布的图片和标题都可以从driver.page_source获取

但是当我试图获取有关图像的更多信息时(例如,喜欢的数量、图像的发布日期)。我需要访问

<script type="text/javascript">window._sharedData = {...}</script>

前面代码中的“...”是一个 JSON 块。它包含前 12 个媒体的详细信息。有没有办法在 window._shareData JSON 块中获取所有图像的详细信息?

感谢您的建议

【问题讨论】:

    标签: python json selenium instagram


    【解决方案1】:

    看看my answer,它可以解决您的问题,但使用 php。无论如何,你可以用 python 做同样的事情:

    1. 通过http从url加载json:https://www.instagram.com/nasa/?__a=1(将nasa替换为任何公共用户名)。

    2. 从 json 中获取 12 个媒体详细信息:user-&gt;media-&gt;nodes

    3. 从 json 中获取额外的媒体信息:user-&gt;media-&gt;page_info。有has_next_page(布尔值)和end_cursor(整数)。使用它来获取 URL 为 https://www.instagram.com/nasa/?__a=1&amp;max_id=[VALUE-FROM-end_cursor] 的下 12 个媒体。

    4. 重复 2-3。

    【讨论】:

    • 感谢您的回复 rNix,它运行良好。我只是想知道在哪里可以找到关于“__a=1”的在线文档。我想我可以在查询中放入更多参数来从 Instagram 服务器获取数据。对吗?
    • @r0ng 我没有看到。但我发现了一个用于查询(获取 cmets、关注者等)的有趣 Web 端点。看update部分stackoverflow.com/questions/40648546/…
    • @r0ng 您可以使用网络版 Instagram 查看浏览器控制台的更多查询示例。
    猜你喜欢
    • 2014-03-30
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-09-24
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多