【发布时间】:2014-12-26 14:21:44
【问题描述】:
我已经设法从网站中选择了所需的内容,使用“选择器小工具”帮助创建了一个“css 选择器”。如何将我选择的内容导出到“R”或使用生成的 css 选择器从该网站上抓取数据?如果您有这样做的想法或经验,任何人都可以指导我。任何帮助表示赞赏。 谢谢
【问题讨论】:
-
您没有提供任何具体细节以便提供具体建议。如果您至少显示一些您正在使用的代码,那将会很有帮助。您是否尝试过在 R 中下载文件或从网页中抓取任何数据?我敢肯定有很多教程会弹出,快速谷歌搜索基础知识。
-
感谢弗利克先生的回复。内容的url是“manuals.bioinformatics.ucr.edu/home/ht-seq”。我不能共享代码只是因为我没有编写任何代码。 .我用鼠标选择了网站的某些内容,我将尝试分享相同的屏幕抓取,结果代码是“”.sites-codesn-p-block“”这是我所做的css选择。
-
我不懂 R,但大多数语言都有一个 CSS 解析库,您可以使用该库来提取文本。请参阅 Ruby 中的 Nokogiri 或 Python 中的 beautifulsoup。
标签: python css r css-selectors ipython