【发布时间】:2020-11-09 16:38:04
【问题描述】:
我正在尝试解析此页面:https://www.ldlc.com/fr-be/informatique/pieces-informatique/carte-professionnelle/c4685/
问题是,在这个元素中:https://gyazo.com/e544be64a41a121bdb0c0f71aef50692, 我想要包含价格的 div。如果你检查页面,你可以看到这部分的 html 代码,如下所示:
<div class="price">
<div class"price">
"thePrice"
<sup>93</sup>
</div>
</div>
但是,当使用 page_soup = soup(my_html_page, 'html.parser') 或 page_soup = soup(my_html_page, 'lxml') 或 page_soup = soup(my_html_page, 'html5lib') 时,我只得到该部分的结果:
<div class="price"></div>
就是这样。我一直在互联网上搜索几个小时,以弄清楚为什么内部 div 没有被解析。
三个不同的解析器,如果这是问题的话,似乎没有一个能够通过内部子级与其父级共享相同类名这一事实。
【问题讨论】:
标签: python html parsing beautifulsoup