【问题标题】:Getting blob links from headers using requests使用请求从标头获取 blob 链接
【发布时间】:2020-12-22 09:56:15
【问题描述】:

我正在抓取一个使用请求和 BeautifulSoup 流式传输免费电影的网站,并且我能够获得流式传输页面。但我需要获取视频源,以便我可以流式传输/下载视频,但我被困在这里。

视频来源为 "src = blob:https://example.com/blabla....etc " ,并非原始来源。

在谷歌搜索 blob 源后,我发现原始视频源将在标题本身中:

(你需要去网络>找到stream.m3u8>复制标题

我们如何用 Python 代码做到这一点?获取该链接?

【问题讨论】:

标签: python python-requests blob request-headers


【解决方案1】:

要访问 M3U8 文件,您可以使用正则表达式解析响应。

#enter code here
import requests
import re
url = 'https://www.someexamplewebsite.com"
response = requests.get(url)
video_link = re.search("https.*m3u8", response.text) #http/https
print(video_link) #m3u8 link
  • 请在继续使用 m3u8 网址之前阅读网站政策。如果它可以免费使用,那么只能使用 m3u8 文件,否则可能违反政策。

  • 更多关于 M3U8 -> M3U8 文件是简单的文本文件,其中包含位于 Internet 上的音频/视频信息。

见:>https://www.lifewire.com/m3u8-file-2621956

要使用 M3U8 文件,您可以使用 Apple 开发的 HLS.js 库。 见:>https://github.com/video-dev/hls.js

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-10-20
    • 1970-01-01
    • 2016-03-21
    • 2013-11-16
    • 2015-10-29
    • 2020-11-16
    相关资源
    最近更新 更多