【问题标题】:Webscraping w/BeautifulSoup return class valueWeb Scraping with/BeautifulSoup 返回类值
【发布时间】:2021-04-11 11:10:03
【问题描述】:

所以我开始学习如何使用 BeautifulSoup 进行网页抓取,但我遇到了一个我似乎无法克服的疑问。 我正在尝试保存每个文章 ID 并打印它,但是我的程序总是什么都不返回。 This is part of the html im using, I want to obtain the value inside data-ad-id(在本例中为 8083037957)

for art in soup.find_all('article'):
 values = [regist.text for regist in art.find_all('data-ad-id')]
 data.append(values)
print(values)

我该如何继续这个?谢谢

【问题讨论】:

  • 请注意,您应该避免发布图片并始终以文本形式发布代码。这样,如果未来的用户查看您的问题,则无需担心图像不再被托管
  • 你的代码没有正确缩进,这可能是问题#1
  • @Z4-tier 我只是在这里格式化的菜鸟对不起
  • 但是我可以看到您是这样粘贴的,所以我认为您粘贴的内容不正确。如果您确定该网站破坏了它并且您的代码正确,那么请将代码用三个反引号括起来(stackoverflow.com/editing-help#code 参见第二部分,其中解释了反引号语法),然后正确缩进。

标签: python web-scraping beautifulsoup


【解决方案1】:

像“soup.article”这样简单的东西可能会解决您的问题!

soup = BeautifulSoup(HTML, "lxml") # Replace 'HTML'
values = soup.article['data-ad-id']
data.append(values)

【讨论】:

  • 对于多个 id,我尝试了一个 for 循环,例如:for art in soup.find_all('article'): values = soup.article['data-ad-id'] data.append(values) .但是,它每页只检索一个 ID,我该如何调整它?谢谢
猜你喜欢
  • 2021-09-03
  • 2020-01-09
  • 1970-01-01
  • 2020-10-30
  • 2021-01-25
  • 2018-04-02
  • 2019-05-03
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多