【发布时间】:2025-02-20 12:00:02
【问题描述】:
我想在没有列表标签的评论中提取列表元素中的文本。但是我不能用下面的代码来做到这一点。
from bs4 import BeautifulSoup, Comment
html = """
<html>
<body>
<!--
<ul>
<li>10</li>
<li>20</li>
<li>30</li>
</ul>
-->
</body>
</html>
"""
soup = BeautifulSoup(html, 'html.parser')
for numbers in soup.findAll(text=lambda text:isinstance(text, Comment)):
print(numbers.extract())
结果是:
<ul>
<li>10</li>
<li>20</li>
<li>30</li>
</ul>
想要的结果:
10
20
30
【问题讨论】:
标签: python-3.x web-scraping beautifulsoup text-extraction