【发布时间】:2020-05-02 10:46:04
【问题描述】:
我在 R 中有一个问题。我有一个 Excel 列,它的所有行都由链接组成。 我想创建一个机器人或以某种方式从该链接获取信息(所有信息都是纯文本 .txt)。 你知道有什么方法可以在右栏中提取信息和仪表吗?问候,谢谢!。
我尝试阅读.delim,但我遇到了这个问题。
read.delim("http://multimedia.globomatik.net/productsSheet/A0017969.txt")
read.table 中的错误(file = file,header = header,sep = sep,quote = quote,: 列多于列名
另一方面,我尝试过:
read.txt("http://multimedia.globomatik.net/productsSheet/A0023294.txt"))
但是为我创建了许多行。你知道有什么方法可以加入这些行吗?
谢谢!
【问题讨论】:
-
您的意思是要对 Excel 文件中的所有链接进行刮板吗?并从所有链接中提取信息?
-
您正在查看的内容似乎是 HTML 而不是简单的纯文本。您需要使用可以解析 HTML 的函数。
标签: r