【问题标题】:How to import messy data in R?如何在 R 中导入杂乱的数据?
【发布时间】:2018-10-03 15:52:34
【问题描述】:

如何在 R 中导入这些数据???太乱了...我不知道是否必须先清理然后导入..我不知道该怎么做....第一行是列的名称.

https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/

【问题讨论】:

  • 这项工作..谢谢..但是当我运行 names(df) [1] "\"fixed acidity" "\"\"volatile acidity\"\"" [3] "\" \"柠檬酸\"\"" "\"\"残糖\"\"" [5] "\"\"氯化物\"\"" "\"\"游离二氧化硫\"\"" [7 ] "\"\"总二氧化硫\"\"" "\"\"密度\"\"" [9] "\"\"pH\"\"" "\"\"硫酸盐\"\"" [11] "\"\"酒精\"\"" "\"\"质量\"\"\""

标签: r import data-cleaning


【解决方案1】:

它不凌乱,但很干净。该文件是一个逗号分隔值文件(尽管分隔符似乎是一个分号)。您可以为此使用 read.delim:

df <- read.delim("winequality-red.csv", sep = ";")

确保文件存储在工作目录中。您可以使用getwd()检查工作目录并通过setwd()更改它

【讨论】:

  • 谢谢..我明白你说的但不运行(文件在正确的目录中)
  • 分享您的代码以便识别错误。你也改变了你的工作目录吗?
  • a
  • a , , 1 [,1] [,2] [1,] "red" "black" [2,] "black" "red" [3,] "red" "black" , , 2 [,1] [,2] [1,] “红” “黑” [2,] “黑” “红” [3,] “红” “黑”
  • 重新下载文件,不要用excel打开。直接在 R 中导入。它在我的机器上运行良好
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-10-30
  • 1970-01-01
  • 2021-10-08
  • 1970-01-01
  • 2021-12-24
相关资源
最近更新 更多