【发布时间】:2019-10-28 03:45:01
【问题描述】:
我正在使用 Beautiful Soup 来抓取以下页面:https://www.nyse.com/quote/XNYS:AAN
我想把股票值下面的名字+缩写。但是,当我运行脚本时,soup.find() 似乎不起作用,因为没有下载整个 html 文件。
main_url = "https://www.nyse.com/quote/XNYS:AAN"
import requests
result = requests.get(main_url)
from bs4 import BeautifulSoup
soup = BeautifulSoup(result.text, 'html.parser')
print(soup.find("div", class_ = "d-dquote-symbol").prettify())
我希望看到包含正确库存值的<span> 的<div>。但是,打印返回“none”,因为脚本找不到此标记。我知道它存在是因为我首先使用了检查元素来查找标签。
【问题讨论】:
-
Inspect 也会显示动态元素。使用查看源代码检查它是否真的存在。
-
使用浏览器的inspect功能向浏览器显示DOM 解释 HTML,也可以用Java Script修改和扩展代码.所有浏览器都有另一个功能来显示实际的未渲染器 HTML 源代码。这就是 beautifulsoup 看到和操作的内容。
标签: python python-3.x web-scraping beautifulsoup