【问题标题】:Import column with multiple values in data.frame r在data.frame r中导入具有多个值的列
【发布时间】:2017-12-06 13:50:39
【问题描述】:

我想在 R 中创建一个 data.frame,其中的一些列具有多个值。数据框是通过导入一个包含多个值的列的 csv 产生的。这是数据框的示例:

name fruit

john    banana, orange, apple
isaac    apple

我想知道是否有任何方法可以分隔 csv 中的数据,以便在导入它们时不会被视为单个字符串。并且在被区分并应用因子()之后,如果它们保持该格式:

> levels(fruit)
 [1] "banana"                                                                                        
 [2] "orange"                                     
 [3] "apple"  

【问题讨论】:

  • 您要做的是将列表存储在 data.frame 单元格中
  • 完全正确,但我想知道是否有任何方法可以更改 csv 中的某些内容,或者是否有一些功能可以将数据作为列表而不是单个字符串导入,因为有很多数据。

标签: r csv dataframe


【解决方案1】:

您要做的是将列表存储在 data.frame 单元格中。要构建您的列表,请使用strsplit

df$fruits = sapply(df$fruit, function(s)strsplit(s, ", "))

关于你的水平,我觉得你的要求有点过分了

【讨论】:

    猜你喜欢
    • 2013-03-25
    • 1970-01-01
    • 2020-11-22
    • 2013-12-20
    • 1970-01-01
    • 2021-06-20
    • 1970-01-01
    • 1970-01-01
    • 2021-12-23
    相关资源
    最近更新 更多