【发布时间】:2011-01-07 09:24:36
【问题描述】:
我想编写一个代码 sn-p,它会在以下所有三个实例中,在 lxml 中获取 <content> 标记内的所有文本,包括代码标记。我试过tostring(getchildren()) 但这会错过标签之间的文本。我在 API 中搜索相关功能时运气不佳。你能帮帮我吗?
<!--1-->
<content>
<div>Text inside tag</div>
</content>
#should return "<div>Text inside tag</div>
<!--2-->
<content>
Text with no tag
</content>
#should return "Text with no tag"
<!--3-->
<content>
Text outside tag <div>Text inside tag</div>
</content>
#should return "Text outside tag <div>Text inside tag</div>"
【问题讨论】:
-
谢谢 - 我正在尝试编写一个 RSS 提要解析器并显示
标记内的所有内容,其中包括来自提要提供者的 HTML 标记。