【发布时间】:2019-01-05 08:55:02
【问题描述】:
我想从 Squawka 抓取玩家评分,如果我只是做一个 URL 请求并使用 BeautifulSoup 解析 Python 中的内容,我看不到评分或玩家名称出现在任何地方。我应该如何进行?具体网址见:
【问题讨论】:
标签: web-scraping
我想从 Squawka 抓取玩家评分,如果我只是做一个 URL 请求并使用 BeautifulSoup 解析 Python 中的内容,我看不到评分或玩家名称出现在任何地方。我应该如何进行?具体网址见:
【问题讨论】:
标签: web-scraping
数据没有嵌入到 html 中,而是从另一个 JSON api http://www2.squawka.com/wp-content/themes/squawka_web/leaderboard_process-v2.php 中检索到的,带有一些 url 参数:
curl -s 'http://www2.squawka.com/wp-content/themes/squawka_web/leaderboard_process-v2.php?type=Player%20Stats&filter=2&league=819&team=0,31,299,301,302,33,169,34,309,315,36,37,38,39,43,44,46,47,323,48,49&played=All%20matches&position=All%20Player%20Positions&agestart=16&ageend=40&noofmatch=0&seasonstart=11/08/2017&seasonend=13/05/2018&by=season×tart=0&timeend=90&is_home=1&showtype=total' | \
jq '[
.result | .. | {total: .data?.total?, name: .info?.full_name?} | select(.total != null)
] | sort_by(.total) | reverse'
【讨论】: