【发布时间】:2017-09-22 08:06:35
【问题描述】:
如何在给定概率的情况下随机抽取样本(有或没有替换)?
我正在尝试在 iris 数据框中提取随机行样本,但具有以下物种条件:
80% 杂色和 20% 维吉尼亚
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
【问题讨论】:
-
通常,我使用函数:randomRows = function(df,n){ return(df[sample(nrow(df),n,rep=F),]) }
-
另见
dplyr::sample_n和dplyr::sample_frac。