【发布时间】:2025-12-02 16:45:02
【问题描述】:
我正在尝试检索所有包含“名称”字段的标签,然后处理整个句子加上名称。 这是我的测试代码:
sourceCode = '<dirtfields name="one" value="stuff">\n<gibberish name="two"\nwewt>'
namesGroup = re.findall('<.*name="(.*?)".*>', sourceCode, re.IGNORECASE | re.DOTALL)
for name in namesGroup:
print name
哪个输出是:
two
我要寻找的输出是
['<dirtfields name="one" value="stuff">', 'one']
['<gibberish name="two"\nwewt>', 'two']
编辑: 找到了一种方法,感谢 doublesharp 以更简洁的方式获取“名称”值。
namesGroup = re.findall(r'(<.*?name="([^"]*)".*?>)', sourceCode, re.IGNORECASE | re.DOTALL)
将输出:
('<dirtfields name="one" value="stuff">', 'one')
('<gibberish name="two"\nwewt>', 'two')
【问题讨论】:
标签: python regex python-2.7