【发布时间】:2013-09-24 06:11:04
【问题描述】:
我正在尝试解析以下页面 http://www.lyricsnmusic.com/roxy-music/while-my-heart-is-still-beating-lyrics/26925936获取相似歌曲列表。
页面源中不存在类似歌曲的列表,但当我在浏览器中使用“检查元素”时会出现。 我该怎么做?? 当前代码:
url = 'http://www.lyricsnmusic.com/roxy-music/while-my-heart-is-still-beating-lyrics/26925936'
request = urllib2.Request(url)
lyricsPage = urllib2.urlopen(request).read()
soup = BeautifulSoup(lyricsPage)
生成链接的代码是:
for p in soup.find_all('p'):
s = p.find('a', { "class" : 'title' }).get('href')
有哪些方法可以做到这一点?
【问题讨论】:
-
该页面使用Last.fm API 加载该数据。
-
application.jsscript 没有被缩小,我建议你去阅读它并自己研究如何使用相同的 API 而不是抓取第三方网站。查找ws.audioscrobbler.com URL。
标签: python web-scraping beautifulsoup