【发布时间】:2015-11-09 12:59:32
【问题描述】:
我无法使用 urllib 读取此 website 的 html 代码
def tests(url):
response = urllib.urlopen(url)
soup = BeautifulSoup(response.read())
universities=soup.findAll('a',{'class':'pin-link'})
print universities
if __name__ == '__main__':
tests("https://pinshape.com/shop?page=3&is-free=true&type=-streamable")
【问题讨论】:
-
它不仅仅是纯 HTML。有javascript激活登录框,更难解析,