【问题标题】:Cannot download a webpage using download.file in R无法使用 R 中的 download.file 下载网页
【发布时间】:2018-08-29 21:39:26
【问题描述】:

我尝试了以下代码来下载 html 文件。代码运行没有错误,但返回的文件非常小(~2kb),无法打开。

url <- "http://racing.hkjc.com/racing/information/english/Horse/OtherHorse.aspx?HorseNo=L042#htop"
download.file(url, destfile)

我不确定连接速度是否会影响 download.file 是否可以返回正确的结果,因为有时可以在多次尝试后下载网页。任何帮助或替代解决方案将不胜感激。谢谢。

【问题讨论】:

  • rvest::read_html 怎么样?

标签: r web-scraping


【解决方案1】:

有很多清理工作要做,但这是基本方法

library(rvest)

read_html(url) %>% 
html_nodes(xpath ='/html/body/div/form/table[3]') %>% 
html_table(fill=T)

【讨论】:

  • 感谢您的快速回复。我也尝试了 rvest::read_html 但遇到了同样的问题。不知道是不是因为html需要加载大量的javascript导致问题。
猜你喜欢
  • 2022-09-22
  • 1970-01-01
  • 2019-10-06
  • 1970-01-01
  • 2021-12-30
  • 2015-09-11
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多