【发布时间】:2021-08-10 19:35:29
【问题描述】:
我想离散化包含连续变量的列。
数据看起来像;
c(0,25,77,423,6,8,3,65,32,22,10,0,8,0,15,0,10,1,2,4,5,5,6)
我想通过离散化将数字变成分类,但零代表不同的类别。有时直接离散化可以保持不同的数字为零。
我想如果我保持零,然后离散化我的愿望就会实现。但是在数据框列中,由于索引,我不能这样做:
这是一个示例dput() 输出
structure(list(dummy_column = c(0, 25, 77, 423, 6, 8, 3, 65,
32, 22, 10, 0, 8, 0, 15, 0, 10, 1, 2, 4, 5, 5, 6)), class = "data.frame", row.names = c(NA,
-23L))
例如,如果我想使用 2 个中断,类别应该是;零和其他3个离散的,共4个类别。如果我可以编写函数来离散化可以直接用dplyr::mutate()创建的列,那应该会更好
提前致谢。
【问题讨论】:
标签: r dplyr discretization