【发布时间】:2021-01-09 03:56:20
【问题描述】:
我对此有点坚持,在这里没有发现类似的问题。
我想获取字符串中所有标签元素的列表,例如, <a> -> a 或 </b> -> b
import re
s = '<p><a href="http://www.quackit.com/html/tutorial/html_links.cfm">Example Link</a></p>'
pat = r'<\s*(\w+)/?\s*.*>'
tags = re.findall(pat, s)
print(tags)
结果我得到['p']。如果我将\w+ 更改为[a-d]+,我只会得到['a']。
我希望结果为 ['p', 'a', 'a', 'p'] 或至少所有不同的标签值。
我在这里做错了什么?谢谢!
使用 Python 3.x
【问题讨论】:
标签: python-3.x regex findall python-re