【发布时间】:2018-02-12 20:56:14
【问题描述】:
我正在尝试从此页面获取我正在从事的项目的产品:lazada, page ispection 使用:
from bs4 import BeautifulSoup
import urllib
import re
r = urllib.urlopen("http://www.lazada.co.id/catalog/?q=note+2").read()
soup = BeautifulSoup(r,"lxml")
letters = soup.findAll("span",class_=re.compile("product-card__name"))
print type(letters)
print letters[0]
当我这样做时,我收到以下错误:
回溯(最近一次通话最后): 文件“C:/Python27/project/testaja.py”,第 9 行,在 打印字母[0] IndexError:列表索引超出范围对此有什么想法吗?
【问题讨论】:
-
print(r)输出什么?该代码对我来说很好。 -
这段代码对我来说也完全没问题。我怀疑你要么没有访问权限(也许你经常抓取它并且服务器阻止了你 - 检查标头代码是否为 403)或者由于某种原因 HTML 从未一起发送。
标签: python beautifulsoup