【发布时间】:2017-02-08 05:31:41
【问题描述】:
我想从网页http://www.moneycontrol.com/financials/afenterprises/profit-lossVI/AFE01#AFE01上的表格中提取数据
我不需要一次整张桌子,而是需要特定的元素
第一个元素的 X 路径是
/html/body/center[2]/div/div[1]/div[8]/div[3]/div[2]/div[2]/div[2]/div[1]/table[2]/tbody/tr[6]/td[2]
我写了一个代码
library(rvest)
library(XML)
FJ<-htmlParse("http://www.moneycontrol.com/financials/afenterprises/profit-lossVI/AFE01#AFE01")
data<-xpathSApply(FJ,"/html/body/center[2]/div/div[1]/div[8]/div[3]/div[2]/div[2]/div[2]/div[1]/table[2]/tbody/tr[6]/td[2]")
print(data)
输出结果是NULL
【问题讨论】:
-
函数
htmlParse不在rvest中,你的意思是XML吗? -
是的,对不起,我同时使用了这两个库。 'XML' 和 'rvest'
标签: r xpath web-scraping rvest