【发布时间】:2013-07-06 19:30:13
【问题描述】:
我正在做一个从网页获取信息的项目。 在 html 源代码中,我有以下内容:
Resultado de Busca: Foram encontrados 264 casais
我需要得到“encontrados”和“casais”之间的数字
在 Python 中是否有这样做的?我应该使用什么字符串函数?在这种情况下,我想避免使用正则表达式。
import urllib.request
f = urllib.request.urlopen("http://listadecasamento.fastshop.com.br/ListaCasamento/ListaCasamentoBusca.aspx?Data=2013-06-07")
s = f.read()
print(s.split())
到目前为止,我得到了这个,但现在我很难找到我需要的号码。
import urllib.request
f = urllib.request.urlopen("http://listadecasamento.fastshop.com.br/ListaCasamento/ListaCasamentoBusca.aspx?Data=2013-06-07")
s = f.read()
num = int(s[s.index("encontrados")+len("encontrados"):s.index("casais")])
这给了我下面的错误
TypeError:类型 str 不支持缓冲区 API
【问题讨论】: