【发布时间】:2016-06-16 20:22:31
【问题描述】:
在使用 R(版本 3.3.0)中的 rvest 包(版本 0.3.1)将信息输入表单后,我试图从网站上抓取数据。以下是我的代码:
# Load Packages
library(rvest)
# Specify URL
url <- "http://www.cocorahs.org/ViewData/ListDailyPrecipReports.aspx"
cocorahs <- html_session(url)
# Grab Initial Form
# Form is filled in stages. Here, only do country and date
form.unfilled <- cocorahs %>% html_node("form") %>% html_form()
form.filled <- form.unfilled %>%
set_values("frmPrecipReportSearch:ucStateCountyFilter:ddlCountry" = "840",
"frmPrecipReportSearch_ucDateRangeFilter_dcStartDate" = "6/15/2016",
"frmPrecipReportSearch_ucDateRangeFilter_dcEndDate" = "6/15/2016")
submit_form(cocorahs, form.filled,
submit="frmPrecipReportSearch:btnSearch") %>%
html_node("form") %>% html_form()
我期待结果显示更新后的表单;当国家更新为美国时,日期范围恢复为默认值(访问日期)。为了确保表单更新该特定字段,我缺少什么?
【问题讨论】: