【发布时间】:2016-10-04 09:47:41
【问题描述】:
当这些标签位于多行/不同行时,如何提取它们之间的内容?
<link>
https://widget.websta.me/rss/n/bleh
</link>
我试过了: 内容 = findall('(.*)', web_page_contents, re.DOTALL) 但我得到的是下一个而不是这个^
【问题讨论】:
-
正则表达式不适合解析 XML,除非它非常简单,即常规 :P 你应该使用一些 xml 处理库。例如阅读:docs.python.org/2/library/…