【发布时间】:2019-03-29 09:39:57
【问题描述】:
我正在尝试通过网络抓取不同 ETF 的一些日常信息。我发现https://www.marketwatch.com/ 有准确的信息。最相关的信息是 ETF 的开盘价、流通股、资产净值、总资产。这是 IVV 美国股票的链接:https://www.marketwatch.com/investing/fund/ivv
我刚刚开始获得 Python 经验,希望收到一些关于如何启动网络抓取程序的提示和指南。有人告诉我 BeutifulSoup 是用于网页抓取的软件包。
我之前用VBA爬过网页,但是我使用的页面的HTML不同,我不知道这是不是因为ETF的某些值(例如Price和Taded Volume)不断变化。
我对任何可能有用的建议或任何其他网站持开放态度(我曾尝试使用 Yahoo Finance 和 Morningstar,但 HTML 代码也遇到了同样的问题)。
【问题讨论】:
-
嗨,API 是抓取数据的最佳方式,数据每秒都在变化,例如股票市场、youtube(观看次数、订阅者)、Twitter、Facebook 等,
-
谢谢 Bhanu Tez,我会寻找可以帮助我了解市场信息的。
标签: python web-scraping beautifulsoup finance