【问题标题】:Scraping data from table从表中抓取数据
【发布时间】:2017-02-08 05:31:41
【问题描述】:

我想从网页http://www.moneycontrol.com/financials/afenterprises/profit-lossVI/AFE01#AFE01上的表格中提取数据 我不需要一次整张桌子,而是需要特定的元素 第一个元素的 X 路径是

/html/body/center[2]/div/div[1]/div[8]/div[3]/div[2]/div[2]/div[2]/div[1]/table[2]/tbody/tr[6]/td[2] 

我写了一个代码

library(rvest)
library(XML)

FJ<-htmlParse("http://www.moneycontrol.com/financials/afenterprises/profit-lossVI/AFE01#AFE01")
data<-xpathSApply(FJ,"/html/body/center[2]/div/div[1]/div[8]/div[3]/div[2]/div[2]/div[2]/div[1]/table[2]/tbody/tr[6]/td[2]")
print(data)

输出结果是NULL

【问题讨论】:

  • 函数htmlParse不在rvest中,你的意思是XML吗?
  • 是的,对不起,我同时使用了这两个库。 'XML' 和 'rvest'

标签: r xpath web-scraping rvest


【解决方案1】:

看起来您在两者之间错过了div,并且您基本上做了一个错误的“turn”...

xpathSApply(FJ,"/html/body/center[2]/div/div[1]/div[8]/div[3]/div[2]/div[2]/div[2]/div[1]/table[2]/tr[6]/td[2]")
xmlValue(xpathSApply(FJ,"/html/body/center[2]/div/div[1]/div[8]/div[3]/div[2]/div[2]/div[2]/div[1]/table[2]/tr[6]/td[2]")[[1]])

【讨论】:

  • 感谢您提供详细信息,但它返回 '53,983.00' 我如何获取 XML 值
  • 你的意思是 53,983.00
  • 是的,我怎样才能得到这个值'53,983.00'
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-07-18
相关资源
最近更新 更多