【发布时间】:2021-10-11 07:25:20
【问题描述】:
我正在尝试 scrape soundcloud 和其他音乐平台以获取数据,但我似乎卡在 soundcloud 上,因为我得到 None、AttributeError 或 [],但是当我尝试 scraping 一个常规网站(非音乐)。我得到数据。我做错了什么请帮忙。
from bs4 import BeautifulSoup
import requests
html_text = requests.get('https://soundcloud.com/jujubucks').text
soup = BeautifulSoup(html_text,'lxml')
song = soup.find('li', class_='soundList__item')
print(song)
这个代码返回这个。
None or AttributeError.
【问题讨论】:
-
歌曲可能是通过javascript动态获取的。看看selenium为了处理javascript。
-
向您的请求添加用户代理
标签: python html web-scraping beautifulsoup data-mining