【发布时间】:2015-11-14 16:00:05
【问题描述】:
我正在尝试使用 rvest 包从网页中抓取数据。在一个简单的格式中,html 代码如下所示:
<div class="style">
<input id="a" value="123">
<input id="b">
</div>
我想从第一个输入中获取值 123。我尝试了以下 R 代码:
library(rvest)
url<-"xxx"
output<-html_nodes(url, ".style input")
这将返回一个输入标签列表:
[[1]]
<input id="a" value="123">
[[2]]
<input id="b">
接下来我尝试使用 html_node 通过 id 引用第一个输入标记:
html_node(output, "#a")
这里它返回了一个空值列表,而不是我想要的输入标签。
[[1]]
NULL
[[2]]
NULL
我的问题是,如何使用其 id 引用输入标签?
【问题讨论】:
标签: html css r web-scraping rvest