【发布时间】:2015-10-14 15:51:22
【问题描述】:
我想将以下标签<b size=5 alt=ref>拆分如下:
Open tag: b
Parm: size=5
Parm: alt=ref
但是,我尝试使用以下代码将标记拆分为组,但它不起作用:
temp = '<b size=5 alt=ref>'
matchObj = re.search(r"(\S*)\s*(\S*)", temp)
print 'Open tag: ' + matchObj.groups()
我的计划是将标签分成几组,然后将第一组打印为开放标签,其余的打印为 Parm。您能否提出任何有助于我解决此问题的想法?
请注意,我从 html 文件中读取标签,但我在这里提到了一个打开标签的示例,并展示了我卡住的部分代码。
谢谢
【问题讨论】:
-
您没有使用 HTML 解析器有什么原因吗?
-