Web Scraping with/BeautifulSoup 返回类值答案

【问题标题】：Webscraping w/BeautifulSoup return class valueWeb Scraping with/BeautifulSoup 返回类值
【发布时间】：2021-04-11 11:10:03
【问题描述】：

所以我开始学习如何使用 BeautifulSoup 进行网页抓取，但我遇到了一个我似乎无法克服的疑问。我正在尝试保存每个文章 ID 并打印它，但是我的程序总是什么都不返回。 This is part of the html im using, I want to obtain the value inside data-ad-id（在本例中为 8083037957）

for art in soup.find_all('article'):
 values = [regist.text for regist in art.find_all('data-ad-id')]
 data.append(values)
print(values)

我该如何继续这个？谢谢

【问题讨论】：

请注意，您应该避免发布图片并始终以文本形式发布代码。这样，如果未来的用户查看您的问题，则无需担心图像不再被托管
你的代码没有正确缩进，这可能是问题#1
@Z4-tier 我只是在这里格式化的菜鸟对不起
但是我可以看到您是这样粘贴的，所以我认为您粘贴的内容不正确。如果您确定该网站破坏了它并且您的代码正确，那么请将代码用三个反引号括起来（stackoverflow.com/editing-help#code 参见第二部分，其中解释了反引号语法），然后正确缩进。

标签： python web-scraping beautifulsoup

【解决方案1】：

像“soup.article”这样简单的东西可能会解决您的问题！

soup = BeautifulSoup(HTML, "lxml") # Replace 'HTML'
values = soup.article['data-ad-id']
data.append(values)

【讨论】：

对于多个 id，我尝试了一个 for 循环，例如：for art in soup.find_all('article'): values = soup.article['data-ad-id'] data.append(values) .但是，它每页只检索一个 ID，我该如何调整它？谢谢