使用请求从标头获取 blob 链接答案

【问题标题】：Getting blob links from headers using requests使用请求从标头获取 blob 链接
【发布时间】：2020-12-22 09:56:15
【问题描述】：

我正在抓取一个使用请求和 BeautifulSoup 流式传输免费电影的网站，并且我能够获得流式传输页面。但我需要获取视频源，以便我可以流式传输/下载视频，但我被困在这里。

视频来源为 "src = blob:https://example.com/blabla....etc " ，并非原始来源。

在谷歌搜索 blob 源后，我发现原始视频源将在标题本身中：

（你需要去网络>找到stream.m3u8>复制标题

我们如何用 Python 代码做到这一点？获取该链接？

【问题讨论】：

请不要发文字图片；见meta.stackoverflow.com/questions/303812/…
我只是想展示如何获取链接，文本本身并不重要:)

标签： python python-requests blob request-headers

【解决方案1】：

要访问 M3U8 文件，您可以使用正则表达式解析响应。

#enter code here
import requests
import re
url = 'https://www.someexamplewebsite.com"
response = requests.get(url)
video_link = re.search("https.*m3u8", response.text) #http/https
print(video_link) #m3u8 link

请在继续使用 m3u8 网址之前阅读网站政策。如果它可以免费使用，那么只能使用 m3u8 文件，否则可能违反政策。
更多关于 M3U8 -> M3U8 文件是简单的文本文件，其中包含位于 Internet 上的音频/视频信息。

见：>https://www.lifewire.com/m3u8-file-2621956

要使用 M3U8 文件，您可以使用 Apple 开发的 HLS.js 库。见：>https://github.com/video-dev/hls.js

【讨论】：