【发布时间】:2012-05-02 04:38:02
【问题描述】:
尝试从 python 2 中的 urllib 转换到 python 3。我可以使用 .urlopen() 输出 html 源代码,但无法使用 .find() 方法对其进行索引。
import urllib.request
fh = urllib.request.urlopen("http://stackoverflow.com")
html = fh.read()
fh.close()
print(html.find("<p>"))
我收到类型错误。我知道它正在返回一个字节数组,但我对它的实际含义很模糊。我已经尝试了一些 SO 答案like this,这些都是死胡同。我的问题是:
在 python 3 中是否有一种直接的本地方法可以将 URL 的页面源作为字符串获取?
【问题讨论】:
-
你为什么不用美汤?
标签: python python-3.x