【发布时间】:2016-03-16 03:11:45
【问题描述】:
我正在尝试抓取的网站上有以下内容
<td align="right">
<span id="ctl00_ContentPlaceHolder1_lblCount1">825 records found, </span>
Page
<input name="ctl00$ContentPlaceHolder1$txtCurrent1" type="text" value="1" maxlength="4" id="ctl00_ContentPlaceHolder1_txtCurrent1" style="width:30px;" />
of
<span id="ctl00_ContentPlaceHolder1_lblTotalPage1">83</span>
<input type="submit" name="ctl00$ContentPlaceHolder1$btnGo1" value="GO" id="ctl00_ContentPlaceHolder1_btnGo1" class="inputbtn" />
</td>
我已经使用 rvest 包尝试了以下代码
pgsession <- html_session(url)
pgform <- html_form(pgsession)[[1]]
filled_form <- set_values(pgform,`ctl00$ContentPlaceHolder1$txtCurrent1` = 2)
result <- submit_form(pgsession,filled_form)
我没有将网站中的下一张表返回给我。我如何使用这个包来提交一个值并取回生成的 HTML?我做了一些探索,也许我应该使用 R 包 httr 和 rcurl 来做到这一点。
【问题讨论】:
标签: r web-scraping rcurl rvest httr