【问题标题】:web scraping - how to download image into a folder python网络抓取 - 如何将图像下载到文件夹 python
【发布时间】:2026-01-04 02:25:01
【问题描述】:

我有这段代码,我想在其中下载图像并将其保存到一个文件夹中,但我正在获取图像的 src。我经历了堆栈溢出,在那里我找到了这个Batch downloading text and images from URL with Python / urllib / beautifulsoup?,但不知道如何继续

这是我的代码,到目前为止我已经尝试过

elm5=soup.find('div', id="dv-dp-left-content")
img=elm5.find("img")
src = img["src"]
print src

如何使用 url 将这些图片下载到文件夹中

【问题讨论】:

  • 您是否阅读了问题中的源代码? <img> 标签只是一个指针src 属性告诉您的浏览器在哪里加载图像。它不直接包含在 HTML 本身中。

标签: python image beautifulsoup


【解决方案1】:

编辑:2021.07.19

urllib (Python 2) 更新到 urllib.request (Python 3)


import urllib.request

f = open('local_file_name','wb')
f.write(urllib.request.urlopen(src).read())
f.close()

src 必须是完整路径 - 例如http://hostname.com/folder1/folder2/filename.ext

如果src/folder1/folder2/filename.ext,则必须添加http://hostname.com/
如果srcfolder2/filename.ext,则必须添加http://hostname.com/folder1/
等等


编辑:示例如何下载* 徽标:)

import urllib.request

f = open('*.png','wb')
f.write(urllib.request.urlopen('https://cdn.sstatic.net/Img/unified/sprites.svg?v=fcc0ea44ba27').read())
f.close()

【讨论】:

    【解决方案2】:

    src 属性包含图片的网址。

    您可以通过以下方式下载它:

    urllib.request.urlretrieve(src, "image.jpg")

    【讨论】: