【问题标题】:Isolating an html element with python用python隔离一个html元素
【发布时间】:2015-07-25 04:46:37
【问题描述】:

您好,我在 python3.4 上使用漂亮的汤来解析 html,但我似乎无法找到正确的代码来正确显示这些 html 标记内的信息。我已经成功地从其他站点解析并提取了信息,但是由于某种原因,当我完成循环以使用此代码显示内容时,空括号会出现 [],就好像没有信息一样。

web=requests.get('https://www.scutify.com/company.aspx?ticker=AAPL')
    Info=web.content
    Scutify=BeautifulSoup(Info,'html.parser')
    price=Scutify.find_all('span',{"id":"latest-price"})
    print(price)
    for item in price:
        print(item.content)

【问题讨论】:

    标签: html python-3.x beautifulsoup


    【解决方案1】:

    这是因为没有任何内容。价格由页面上的 javascript 动态生成。 Requests 和 BeautifulSoup 无法获取该数据,因为它们不执行 javascript,它们只是将代码读取为字符串。

    也就是说,你很幸运。阅读 javascript 会发现一个可预测的 URL,您可以使用它来获取 JSON 中的所有股票信息:/service/get-quote.ashx?ticker=

    所以要获取 AAPL 的信息,您只需 GET https://www.scutify.com/service/get-quote.ashx?ticker=AAPL

    【讨论】:

    • 如果我可以问一下,您是如何找到那个 URL 的?
    猜你喜欢
    • 1970-01-01
    • 2013-10-26
    • 2016-08-04
    • 1970-01-01
    • 2011-09-23
    • 2020-10-08
    • 2015-03-27
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多