【问题标题】:how to use 'selector gadget' to scrape data into R?如何使用“选择器小工具”将数据抓取到 R 中?
【发布时间】:2014-12-26 14:21:44
【问题描述】:

我已经设法从网站中选择了所需的内容,使用“选择器小工具”帮助创建了一个“css 选择器”。如何将我选择的内容导出到“R”或使用生成的 css 选择器从该网站上抓取数据?如果您有这样做的想法或经验,任何人都可以指导我。任何帮助表示赞赏。 谢谢

【问题讨论】:

  • 您没有提供任何具体细节以便提供具体建议。如果您至少显示一些您正在使用的代码,那将会很有帮助。您是否尝试过在 R 中下载文件或从网页中抓取任何数据?我敢肯定有很多教程会弹出,快速谷歌搜索基础知识。
  • 感谢弗利克先生的回复。内容的url是“manuals.bioinformatics.ucr.edu/home/ht-seq”。我不能共享代码只是因为我没有编写任何代码。 .我用鼠标选择了网站的某些内容,我将尝试分享相同的屏幕抓取,结果代码是“”.sites-codesn-p-block“”这是我所做的css选择。
  • 我不懂 R,但大多数语言都有一个 CSS 解析库,您可以使用该库来提取文本。请参阅 Ruby 中的 Nokogiri 或 Python 中的 beautifulsoup。

标签: python css r css-selectors ipython


【解决方案1】:

今天我遇到了这个网页,它通过动手教程帮助完美地回答了我自己的问题。

http://blog.rstudio.org/2014/11/24/rvest-easy-web-scraping-with-r/

我希望它有一些用处。

感谢大家及时的建议和意见。

【讨论】:

    猜你喜欢
    • 2017-10-27
    • 1970-01-01
    • 2023-04-06
    • 2020-05-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-05-15
    相关资源
    最近更新 更多