从 nse 网站抓取表格（股票历史）数据答案

【问题标题】：Scraping Tabular(Equity historical) data from the nse website从 nse 网站抓取表格（股票历史）数据
【发布时间】：2019-02-11 12:08:23
【问题描述】：

我正在尝试从 nse 网站上抓取股票历史数据： https://www.nseindia.com/products/content/equities/equities/eq_security.htm

我尝试在过去 2 周的范围（时间段）内为一家名为 RELIANCE 的公司（符号名称）抓取数据并将内容传输到 CSV 文件

library(rvest)

url <- "https://www.nseindia.com/products/dynaContent/common/productsSymbolMapping.jsp?symbol=RELIANCE&segmentLink=3&symbolCount=2&series=ALL&dateRange=15days&fromDate=&toDate=&dataType=PRICEVOLUMEDELIVERABLE"
page_html <- read_html(url)
data <- html_nodes(page_html, "p")
data <- html_text(data)

write.csv(data$data, "scrapedData.csv", row.names=FALSE)

它说字符（空）

我知道网站上有一个下载 csv 文件的选项，但我想要一个自动化的 R 脚本来获取数据。

我知道还有其他软件包，例如 quantmod，用于获取历史股票数据，但我需要从这个网站获取，因为它包含有用的信息，例如 TTQ、营业额等。

【问题讨论】：

第 12 点 nseindia.com/wap/mobile_termsofuse.htm 不允许报废
可以参考nser包下载历史bhavcopy。 cran.r-project.org/web/packages/nser/index.html

标签： r web-scraping finance

【解决方案1】：

为什么要重新发明轮子？

你可以使用 nsepy python 模块。 https://github.com/swapniljariwala/nsepy

存在类似的替代方案。

【讨论】：

【解决方案2】：

你只需要使用这个：

from nsepy import get_history
from datetime import date
data = get_history(symbol="SBIN", start=date(2015,1,1), end=date(2015,1,31))

【讨论】：