【发布时间】:2021-11-03 09:31:22
【问题描述】:
我正在尝试从下拉框中提取数据列表。当我检查 html 源代码时,它嵌套在这个 div 数据应用程序中,如下所示:
<div data-app="true" id="app" class="application application--light"></div>
<div class="card" style="height:auto;" data-ripple="false">
<ul data-uid="669" class="list">
<li><a href="javascript:;" class="list__tile list__tile--link" data-ripple="true" style="position: relative;"><div class="list__tile__content">
<div class="list__tile__title">Car 1</div></div></a></li>
<li><a href="javascript:;" class="list__tile list__tile--link" data-ripple="true"><div class="list__tile__content">
<div class="list__tile__title">Car 2</div></div></a></li>
谁能告诉我如何从 div class="list__tile__title" 中提取“Car 1”和“Car 2”。尝试如下使用 beautifulsoup,但似乎无法提取任何内容。
for title in soup.find_all('div', attrs={'class': 'list__tile__tile'}):
content_d = title.descendants
for d in content_d:
if d.name == 'div' and d.get('class', '') == ['list__tile__title']:
print(title.text)
这是正确的使用方法吗?
谢谢!
【问题讨论】:
-
欢迎来到 SO - 请改进您的问题,以便我们重现您的问题。如何创建minimal reproducible example 谢谢(一些代码、url、html 示例会很酷且很有帮助)
-
请发布 HTML/URL、您的代码以及您对代码的期望
-
已添加代码和预期输出。谢谢。
标签: python html web-scraping beautifulsoup