【问题标题】:Problems getting the page source with urlopen [closed]使用 urlopen 获取页面源时出现问题 [关闭]
【发布时间】:2012-11-05 12:32:17
【问题描述】:

本网站http://rockantenne.de/webplayer 上的网络播放器有一个播放列表,其中包含当天迄今为止播放的所有歌曲。

当我在 Firefox 中按 Ctrl-U 查看页面的源代码时,我可以看到所有播放的歌曲。但是,如果我使用 urllib2.urlopen 然后 read() 它,除了歌曲被忽略之外,一切都是一样的。

谁能告诉我这里有什么问题?

谢谢

【问题讨论】:

    标签: python urllib2 urlopen


    【解决方案1】:

    页面使用AJAX异步加载歌曲列表,来自http://www.rockantenne.de/webplayer/xml/livesongcache.xml?82321

    加载那个 URL,然后自己解析返回的 XML。

    【讨论】:

    • 啊。非常感谢。请问您是在哪里找到这些信息的?
    • @derwahre_tj:我使用了浏览器的开发者工具。 Chrome、Safari 和 Firefox 都可以告诉您页面发出了哪些请求。
    • 不幸的是不完全。因为通过仔细观察,我发现每次调用链接时都可以获得最近播放的歌曲,而不是像在 firefox 中执行 ctrl-u 时获得的完整列表。
    • @derwahre_tj:您必须分析该页面如何处理 URL 和数据;这太本地化了,无法在这里回答。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-03-17
    • 2011-09-23
    • 1970-01-01
    • 1970-01-01
    • 2018-06-06
    • 2022-01-23
    相关资源
    最近更新 更多