【发布时间】:2019-06-30 10:21:33
【问题描述】:
我正在尝试从 Craigslist 抓取列表信息,不幸的是,我似乎无法获取图像,因为它们是幻灯片。
import requests
from bs4 import BeautifulSoup as soup
url = "https://newyork.craigslist.org/search/sss"
r = requests.get(url)
souped = soup(r.content, 'lxml')
由于图像甚至不在请求的 html 文件中,我是否需要以某种方式动态加载页面或其他东西。如果是这样,我只能将它保存在 python 中,我不想要任何其他依赖项。在此先感谢,对此非常陌生,因此任何帮助都会有所帮助。
【问题讨论】:
-
如您所见,您有图像的链接,我建议您提取 URL,然后使用
requests使用这些 URL 下载图像。请参阅this post 以使用该模块下载图像 -
谢谢,但我不想下载图片,只是想要链接。我有一个循环,可以将列表的标题、位置、价格等添加到 CSV 文件中,我只是希望它也将图像的链接添加到其中。对不起,我是 python 的菜鸟,所以一个简单的解决方案会很有帮助。
标签: python html css web-scraping beautifulsoup