【问题标题】:Getting the download url of a video from a site从网站获取视频的下载 url
【发布时间】:2019-02-04 06:14:54
【问题描述】:

我正在尝试构建一个从“fmovies.se”下载视频的网络爬虫。

给定网页,我无法完全提取视频网址。

我正在考虑的网页是“https://fmovies.se/film/la-cage-doree.5283j”。

需要两次查询才能检索视频网址。

第一个是'https://fmovies.se/ajax/episode/info?ts=1483027200&=2399&id=9076jn&update=0'。

查询由“ts”、“_”、“id”和“update”元素组成。网页的html代码中除了“_”部分之外的所有内容。

我无法知道“_2399”部分的来源。

谁能帮我解决这个问题?

【问题讨论】:

  • 详细阐述你的问题并分享sn-p看看问题是什么......
  • @DinuDuke 更新了问题
  • 我仍然无法得到你...给我看一些代码 sn-p...

标签: web-scraping


【解决方案1】:

即使您弄清楚这些参数是如何计算的,它们也可以随时更改其算法,本网站过去专门这样做过,请参阅thread

您需要一个持久的解决方案——无头浏览器。

您可以使用无头浏览器以编程方式模拟用户交互并拦截您正在寻找的 XHR 请求(例如https://fmovies.se/ajax/episode/info?ts=1483027200&=2399&id=9076jn&update=0)。

目前最好的无头浏览器之一是Puppeteer,并且有很多关于如何使用它的信息。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2014-02-01
    • 1970-01-01
    • 2012-08-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-09-28
    相关资源
    最近更新 更多