【问题标题】:R- Scraping Wikipedia list in to a tableR-将维基百科列表抓取到表格中
【发布时间】:2016-12-15 05:00:43
【问题描述】:

我正在尝试使用 R 从 Wikipedia 页面 (https://en.wikipedia.org/wiki/List_of_hub_airports) 上的列表中创建美国枢纽机场表。我是网络抓取的新手,因此我们将不胜感激任何帮助或建议。我正在尝试获取类似于以下内容的表格,其中包含来自美国每个州的信息。

Example of airport hub table

谢谢!

【问题讨论】:

  • 这个问题非常广泛。拉取数据和解析本身就是一个项目。请不要让别人为你完成你的工作。这不是代码编写服务。如果您想就您遇到特别困难的项目的某个方面获得一般性提示,请将您的问题限制在此范围内。
  • 如果您只是在寻找有关机场位置的信息,您可能需要考虑这个问题和答案:stackoverflow.com/questions/37572731/…
  • 感谢 cmets 和下面的代码,它帮助阐明了如何解析网页。我承认我写这个问题很仓促,我应该花时间让这个问题更加集中。我并不想找其他人来做这项工作,因为我说我是网络抓取的新手,我正在寻找有关如何解决这个特定问题的建议。再次感谢您。

标签: r web-scraping wikipedia


【解决方案1】:

虽然整个项目都会是一个挑战,但这里是拉美国数据的开始。

library(rvest)
site <- "https://en.wikipedia.org/wiki/List_of_hub_airports"
txt <- read_html(site) %>%
  html_nodes("#mw-content-text :nth-child(1)") %>%
  html_text()
usatext <- txt[1866:2329]

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2020-07-16
    • 1970-01-01
    • 2016-09-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-07-20
    • 2019-05-24
    相关资源
    最近更新 更多