【发布时间】:2013-08-11 04:15:51
【问题描述】:
我正在尝试使用正则表达式来解析 XML 文件(在我的情况下,这似乎是最简单的方法)。
例如,一行可能是:
line='<City_State>PLAINSBORO, NJ 08536-1906</City_State>'
要访问标签 City_State 的文本,我使用的是:
attr = re.match('>.*<', line)
但没有返回任何内容。
谁能指出我做错了什么?
【问题讨论】:
-
我不得不链接this answer。
-
一旦找到您喜欢的库,使用合适的 XML 库并不难。我发现ElementTree 是标准库中最好用的,untangle 是最简单的(它将 XML 转换为常规字典/列表等)
-
当,@Johnsyweb 打败了我!
-
>谁能指出我做错了什么? A:您正在尝试使用正则表达式解析 XML。
-
我之前尝试过 ElementTree,但我遇到了内存问题。文件大小为 250Mb。由于我正在解析的 XML 文件非常简单,所以我认为使用正则表达式更容易。