【发布时间】:2021-06-11 15:04:49
【问题描述】:
我想从 IMDB 网站上抓取特定电影的所有评论。我也使用了 BeautifulSoup 包的“Html-parser”。
Link
考虑这个链接,我想抓取这部电影的所有电影评论(即 Total = 69),但由于页面上可以看到 25 条评论,所以 Soup 将只提取 25 条评论而不是这里的 Total 评论。
我的代码:
url = "https://www.imdb.com/title/tt6654210/reviews?ref_=tt_ov_rt"
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
review_list = getReviewsList(soup)
len(review_list)
输出:
25
我对网络抓取很陌生,如果有人能帮助我,我将不胜感激。
【问题讨论】:
标签: python web-scraping beautifulsoup imdb