【问题标题】:Scraping Tabular(Equity historical) data from the nse website从 nse 网站抓取表格(股票历史)数据
【发布时间】:2019-02-11 12:08:23
【问题描述】:

我正在尝试从 nse 网站上抓取股票历史数据: https://www.nseindia.com/products/content/equities/equities/eq_security.htm

我尝试在过去 2 周的范围(时间段)内为一家名为 RELIANCE 的公司(符号名称)抓取数据并将内容传输到 CSV 文件

library(rvest)

url <- "https://www.nseindia.com/products/dynaContent/common/productsSymbolMapping.jsp?symbol=RELIANCE&segmentLink=3&symbolCount=2&series=ALL&dateRange=15days&fromDate=&toDate=&dataType=PRICEVOLUMEDELIVERABLE"
page_html <- read_html(url)
data <- html_nodes(page_html, "p")
data <- html_text(data)

write.csv(data$data, "scrapedData.csv", row.names=FALSE)

它说字符(空)

我知道网站上有一个下载 csv 文件的选项,但我想要一个自动化的 R 脚本来获取数据。

我知道还有其他软件包,例如 quantmod,用于获取历史股票数据,但我需要从这个网站获取,因为它包含有用的信息,例如 TTQ、营业额等。

【问题讨论】:

标签: r web-scraping finance


【解决方案1】:

为什么要重新发明轮子?

你可以使用 nsepy python 模块。 https://github.com/swapniljariwala/nsepy

存在类似的替代方案。

【讨论】:

    【解决方案2】:

    你只需要使用这个:

    from nsepy import get_history
    from datetime import date
    data = get_history(symbol="SBIN", start=date(2015,1,1), end=date(2015,1,31))
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2011-03-23
      • 2014-09-25
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2023-03-10
      • 2016-08-13
      相关资源
      最近更新 更多