【发布时间】:2019-08-22 04:37:01
【问题描述】:
我想从论坛获取一些图片。 find_all 结果给了我最想要的东西,它们是 jpeg 文件。然而,它也给了我一些我不想要的 gif 文件。另一个问题是gif文件是附件,不是有效链接,我保存文件时会引起麻烦。
soup_imgs = soup.find(name='div', attrs={'class':'t_msgfont'}).find_all('img', alt="")
for i in soup_imgs:
src = i['src']
print(src)
我试图在我的 find_all 选择搜索中避免使用 gif 文件,但没用,jpeg 和 gif 文件都在同一部分中。那我应该怎么做才能过滤我的结果呢?请给我一些帮助,酋长。我对编码非常业余。玩 Python 只是我的一个爱好。
【问题讨论】:
-
您能否提供示例输出和附加代码(如果需要,请提供一个虚拟站点 url)?另外,不知道细节,你试过简单的`if`条件过滤吗?
标签: python-3.x beautifulsoup python-requests jpeg gif