用python隔离一个html元素答案

【问题标题】：Isolating an html element with python用python隔离一个html元素
【发布时间】：2015-07-25 04:46:37
【问题描述】：

您好，我在 python3.4 上使用漂亮的汤来解析 html，但我似乎无法找到正确的代码来正确显示这些 html 标记内的信息。我已经成功地从其他站点解析并提取了信息，但是由于某种原因，当我完成循环以使用此代码显示内容时，空括号会出现 []，就好像没有信息一样。

web=requests.get('https://www.scutify.com/company.aspx?ticker=AAPL')
    Info=web.content
    Scutify=BeautifulSoup(Info,'html.parser')
    price=Scutify.find_all('span',{"id":"latest-price"})
    print(price)
    for item in price:
        print(item.content)

【问题讨论】：

标签： html python-3.x beautifulsoup

【解决方案1】：

这是因为没有任何内容。价格由页面上的 javascript 动态生成。 Requests 和 BeautifulSoup 无法获取该数据，因为它们不执行 javascript，它们只是将代码读取为字符串。

也就是说，你很幸运。阅读 javascript 会发现一个可预测的 URL，您可以使用它来获取 JSON 中的所有股票信息：/service/get-quote.ashx?ticker=

所以要获取 AAPL 的信息，您只需 GET https://www.scutify.com/service/get-quote.ashx?ticker=AAPL

【讨论】：

如果我可以问一下，您是如何找到那个 URL 的？