【发布时间】:2021-08-08 17:33:19
【问题描述】:
我在这里有一个网站,它的链接结构是这样的
https://example.com/assets/contents/1627347928.mp4
https://example.com/assets/contents/1627342345.mp4
https://example.com/assets/contents/1627215324.mp4
我想使用 python 来获取所有下载链接,当我访问文件夹 /assets/contents/ 时,我得到一个 404 错误,所以我看不到从这个 web 文件夹下载的所有媒体,但是我知道所有的 MP4 文件都有 10 个字符,并且都以“1627******.mp4”开头 我可以做一个循环来检查该网站的所有链接并获取所有有效链接吗?谢谢!!!!!!!!!!!!我现在是 python 新手!
我可以检查是否有带有该代码的媒体 mp4/媒体我可以看到文件的标题,但是如何创建一个循环来检查所有链接并自动下载?或者只是告诉我有效的链接?谢谢!!
import requests
link = 'https://example.com/assets/contents/1627347923.mp4'
r = requests.get(link, stream=True)
print(r.headers)
【问题讨论】:
-
你从哪里得到链接?一个html页面?请张贴具体信息。
-
我这里没有所有链接,也不能在这里发布真实链接,因为它是私有内容,但链接结构是 example.com/assets/contents/1627*** ***.mp4,我想对这 6 个字符循环到 000000 到 999999 并获取所有媒体!现在明白了吗?
-
names = [ 1627347923, 1627347924, 1627347925]列出一个列表,对其进行迭代并构建链接为'https://example.com/assets/contents/{}.mp4'.format(item)
标签: python file web-scraping python-requests download