【发布时间】:2014-07-01 03:22:49
【问题描述】:
我在 GAE 上使用 python
我正在尝试从 html 中获取以下内容
<TD><FONT FACE="Arial,helvetica" SIZE="-2">V1068078</FONT></TD>
我想得到所有后面都有一个“V”和 7 个或更多数字的东西。
我的正则表达式是
response = urllib2.urlopen(url)
html = response.read()
tree = etree.HTML(html)
mls = tree.xpath('/[V]\d{7,10}</FONT>')
self.response.out.write(mls)
它抛出了一个无效的表达式。我不知道它的哪一部分是无效的,因为它适用于在线正则表达式测试器
如何以 xpath 格式执行此操作?
【问题讨论】: