【发布时间】:2019-10-17 02:37:31
【问题描述】:
我是网络抓取的初学者,我正在按照本教程 (https://www.dataquest.io/blog/web-scraping-beautifulsoup/) 来提取电影数据,我认为我对“first_movie”的定义很糟糕!
这是代码
from requests import get
from bs4 import BeautifulSoup
first_movie =[]
url = 'http://www.imdb.com/search/title?
release_date=2017&sort=num_votes,desc&page=1'
response = get(url)
html_soup = BeautifulSoup(response.text, 'html.parser')
type(html_soup)
movie_containers = html_soup.find_all('div', class_ = 'lister-item mode-advanced')
first_name = first_movie.h3.a.text
我收到此错误:
Traceback (most recent call last):
File "mov1.py", line 13, in <module>
first_name = first_movie.h3.a.text
AttributeError: 'list' object has no attribute 'h3'
【问题讨论】:
-
你想用 h3 做什么?
-
@Jeppe 那行不通,因为
first_movie没有元素,它是一个空列表。 -
@MatiasCicero 对不起,我看错了。
html_soup.find_all返回一个列表。这些可能中的每一个都包含一个h3。例如。movie_containers[0].h3.a.text。 See documentation
标签: python html web-scraping beautifulsoup