【问题标题】:Convert of Data Type to factor [duplicate]将数据类型转换为因子 [重复]
【发布时间】:2019-05-05 14:58:00
【问题描述】:

我有一个包含 42 列和 10k 行的庞大数据集。我正在尝试将我的整个数据框(比如数据)更改为因子数据类型。但是当我使用代码时,它需要很长时间才能运行。有没有相同的捷径?

as.factor(data)

我需要一个花费更少时间的代码。

【问题讨论】:

  • 你是如何将数据读入 R 的?在阅读时确保使用参数colClasses="factor",在这种情况下,所有列都是因子。如果您可以运行更快的循环,那么rapply(data,as.factor,how="replace") 应该可以工作
  • data[] <- lapply(data, as.factor)
  • 我使用 'data = read.csv("cleaned_data.csv")' 将数据读入 R

标签: r logistic-regression


【解决方案1】:

是否需要对所有 42 列进行格式化?如果没有,那么您可能需要考虑索引:

as.factor(data[, x])

其中 x 代表列号。

【讨论】:

  • 第二个命令不正确。您不能在列表上运行as.factor()。记住数据框是一个特殊的列表。此外,如果它是一个矩阵,级别将跨越列,因此仍然不正确
  • @Onyambu 谢谢。我已经删除了第二条语句。
【解决方案2】:
data[] <- lapply(data, factor)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2011-09-29
    • 1970-01-01
    • 1970-01-01
    • 2019-12-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多