【发布时间】:2017-03-07 19:51:14
【问题描述】:
有没有人有从 Yahoo! 抓取数据的经验?使用 R 的财务关键统计页面?我熟悉使用 rvest 包中的 read_html、html_nodes() 和 html_text() 直接从 html 抓取数据。但是,这个网页MSFT key stats 有点复杂,我不确定是否所有的统计数据都保存在 XHR、JS 或 Doc 中。我猜数据存储在 JSON 中。如果有人知道用 R 提取和解析此网页数据的好方法,请回答我的问题,非常感谢!
或者如果有更方便的方法通过quantmod 或Quandl 提取这些指标,请告诉我,这将是一个非常好的解决方案!
【问题讨论】:
-
作为替代方案,您可以查看
quantmod中的getFinancials()和viewFinancials()方法,不过它使用来自Google Finance 的数据,其他src 参数尚未实现。 -
使用
docl = htmlParse('http://finance.yahoo.com/quote/MSFT/key-statistics?p=MSFT'),您可以看到(function (root) { /* -- Data -- */的部分,其中显然是数据。例如"beta":{"raw":1.39107,"fmt":"1.39"},祝你好运! -
谢谢@Robert,我还在 XHR Y! Finanace Stats 中找到了另一个文档,它为指标存储了一个干净的 JSON!非常感谢,稍后会分享解析脚本。
标签: r web-scraping quantmod rvest quandl