【发布时间】:2019-03-19 22:52:12
【问题描述】:
目前有以下数据表
如您所见,1 发生的概率是 30%,2 是 50%,3 是 20%
我想根据该概率对该列中的值进行采样
所以我想要这样的东西
如您所见 - 前两列不受影响
关于如何做到这一点的任何想法 - 我认为示例函数会有所帮助,但不确定如何使其工作
【问题讨论】:
-
能详细解释一下
col3的逻辑吗? -
我刚刚创建了 i 作为示例。它只包含这 3 个值,而概率是我创建的
-
没有其他行 - 我如何根据值出现的概率重新排列该列中的值 - 所以我希望 2 出现 50% 的时间 - 这里的例子是5次,让大家更容易理解!
-
df$col3 <- sample(df$col3)? -
?^ 下面给出答案!