【发布时间】:2019-10-27 19:36:15
【问题描述】:
我一直在尝试使用 R 从 Yahoo Finance 抓取财务数据,但未能成功。您可以在下面看到我当前的代码。主要问题似乎是在 Yahoo Finance 中存储财务数据的表没有被建模为 HTML 代码中的表。如何绕过这个问题?
我已经尝试复制似乎包含该表的 Xpath,但没有成功。
library(XML)
symbol = "HD"
url <- paste('https://finance.yahoo.com/quote/HD/financials?p=',symbol,sep="")
webpage <- readLines(url)
html <- htmlTreeParse(webpage, useInternalNodes = TRUE, asText = TRUE)
tableNodes <- getNodeSet(html, "//table")
data <- readHTMLTable(tableNodes)
【问题讨论】:
标签: r web-scraping