【发布时间】:2019-05-05 14:58:00
【问题描述】:
我有一个包含 42 列和 10k 行的庞大数据集。我正在尝试将我的整个数据框(比如数据)更改为因子数据类型。但是当我使用代码时,它需要很长时间才能运行。有没有相同的捷径?
as.factor(data)
我需要一个花费更少时间的代码。
【问题讨论】:
-
你是如何将数据读入 R 的?在阅读时确保使用参数
colClasses="factor",在这种情况下,所有列都是因子。如果您可以运行更快的循环,那么rapply(data,as.factor,how="replace")应该可以工作 -
或
data[] <- lapply(data, as.factor) -
我使用 'data = read.csv("cleaned_data.csv")' 将数据读入 R
标签: r logistic-regression