从表中抓取数据答案

【问题标题】：Scraping data from table从表中抓取数据
【发布时间】：2017-02-08 05:31:41
【问题描述】：

我想从网页http://www.moneycontrol.com/financials/afenterprises/profit-lossVI/AFE01#AFE01上的表格中提取数据我不需要一次整张桌子，而是需要特定的元素第一个元素的 X 路径是

/html/body/center[2]/div/div[1]/div[8]/div[3]/div[2]/div[2]/div[2]/div[1]/table[2]/tbody/tr[6]/td[2]

我写了一个代码

library(rvest)
library(XML)

FJ<-htmlParse("http://www.moneycontrol.com/financials/afenterprises/profit-lossVI/AFE01#AFE01")
data<-xpathSApply(FJ,"/html/body/center[2]/div/div[1]/div[8]/div[3]/div[2]/div[2]/div[2]/div[1]/table[2]/tbody/tr[6]/td[2]")
print(data)

输出结果是NULL

【问题讨论】：

函数htmlParse不在rvest中，你的意思是XML吗？
是的，对不起，我同时使用了这两个库。 'XML' 和 'rvest'

标签： r xpath web-scraping rvest

【解决方案1】：

看起来您在两者之间错过了div，并且您基本上做了一个错误的“turn”...

xpathSApply(FJ,"/html/body/center[2]/div/div[1]/div[8]/div[3]/div[2]/div[2]/div[2]/div[1]/table[2]/tr[6]/td[2]")
xmlValue(xpathSApply(FJ,"/html/body/center[2]/div/div[1]/div[8]/div[3]/div[2]/div[2]/div[2]/div[1]/table[2]/tr[6]/td[2]")[[1]])

【讨论】：

感谢您提供详细信息，但它返回 '53,983.00' 我如何获取 XML 值
你的意思是 53,983.00
是的，我怎样才能得到这个值'53,983.00'