【发布时间】:2019-05-27 13:36:33
【问题描述】:
不幸的是,我还不是一个经验丰富的爬虫。但是,我需要使用 R 从 Yahoo Finance 抓取多只股票的关键统计数据。
我对使用 rvest 包中的 read_html、html_nodes() 和 html_text() 直接从 html 抓取数据有点熟悉。但是,此网页 MSFT 关键统计信息有点复杂,我不确定所有统计信息是否都保存在 XHR、JS 或 Doc 中。我猜数据存储在 JSON 中。
如果有人知道用 R 提取和解析此网页的数据的好方法,请回答我的问题,提前非常感谢!
或者如果有更方便的方法通过 quantmod 或 Quandl 提取这些指标,请告诉我,这将是一个非常好的解决方案!
目标是将票据/符号作为行名/行标签,而将统计信息标识为列。可以在此 Finviz 链接中找到我的需求说明:
https://finviz.com/screener.ashx
我想抓取 Yahoo Finance 数据的原因是因为 Yahoo 还考虑了 Enterprise、EBITDA 关键统计数据。
编辑: 我的意思是参考关键统计页面..例如..:https://finance.yahoo.com/quote/MSFT/key-statistics/。该代码应导致一个数据框行股票代码和关键统计数据列。
【问题讨论】:
-
@NColl 我之前确实考虑过这个话题。然而,最重要的答案与抓取 Finviz 相关..
标签: r web-scraping rvest quantmod quandl