【发布时间】:2016-01-22 14:20:06
【问题描述】:
我正在尝试从http://google.com 中抓取内容。 错误信息出来了。
library(rvest)
html("http://google.com")
open.connection(x, "rb") 中的错误:
已达到超时另外:
警告消息:“html”已弃用。
请改用“read_html”。
查看帮助(“已弃用”)
由于我使用的是公司网络,这可能是由防火墙或代理引起的。我尝试使用 set_config ,但不工作。
【问题讨论】:
-
您是否也尝试过
read_html命令,因为错误消息显示html已弃用...这可能无法解决您的问题,但也许输出更有帮助... -
是的,消息是:Open.connection(x, "rb") 中的错误:已达到超时另外:警告消息:关闭未使用的连接 3 (google.com)
-
实际上,这段代码在我的家庭网络中运行良好。但是当我尝试在公司网络中使用此代码时,出现错误。
-
似乎无法重现为代码问题,这将为我返回结果。如果您弄清楚网络发生了什么以及如何解决它,您可以发布该答案。
-
对我来说同样的问题,显然来自我使用的网络谷歌要求证明不是机器人,当刮板运行时页面当然会超时。