【发布时间】:2021-08-23 11:21:48
【问题描述】:
我在使用 Python 和 requests-html lib 解析网页方面需要帮助。这里是我要分析的<div>:
<div class="answer"><span class="marker">А</span>Te<b>x</b>t</div>
它呈现为:
Text
我需要得到Te<b>x</b>t 作为解析的结果,没有<div> 和<span> 但带有<b> 标签。
使用 element 作为 requests-html 对象,这就是我得到的。
element.html:
<div class="answer"><span class="marker">А</span>Te<b>x</b>t</div>
element.text:
ATe\nx\nt
element.full_text:
AText
你能告诉我如何摆脱<span>,但在解析结果中仍然得到<b>标签吗?
【问题讨论】:
标签: python parsing python-requests python-requests-html