【问题标题】:Accessing Span Elements访问跨度元素
【发布时间】:2020-11-01 21:10:37
【问题描述】:

当试图从 IMDB 评论中刮出电影评论的整数值时,我对如何访问评级感到困惑,因为它的检查 html 刚刚被列为 10,并且每个单独的评级都发生了变化(即 7 。如何我使用soup.find_all 来访问这些值并将它们添加到列表中——当没有为变量列出类时,我很困惑如何做到这一点?

rate=soup.find_all('span')
rate_list=[]
for i in range(0,len(rate)):
    rate_list.append(rate[i].get_text())

【问题讨论】:

标签: web web-scraping beautifulsoup python-requests


【解决方案1】:

尝试使用目标跨度位于星星旁边的事实

ratings = [i.text for i in soup.select('.ipl-star-icon + span')]

但是,如果所有内容都有评分,我可能会循环评论 (for review in soup.select('.lister-item-content): .....) 并测试 review.select_one('.ipl-star-icon + span') is not None

【讨论】:

    猜你喜欢
    • 2017-12-01
    • 2011-12-09
    • 2013-10-21
    • 2019-04-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-08-04
    相关资源
    最近更新 更多