【发布时间】:2022-08-18 00:02:17
【问题描述】:
我有一个包含 40% 女性和 60% 男性的数据集。我还有一个工作角色专栏,其中 85% 是管理。我想随机删除行,直到我达到最多 50% 的男性和 50% 的工作角色管理。
我可以找到几种解决方案来解决如何删除满足这些条件的所有行,但没有什么能让我指定只删除一定数量或百分比的行。
任何人都可以建议可以实现这一目标的代码吗?
-
共享您的代码和数据,以便其他人可以提供帮助
-
您可以通过使用
sample函数来执行此操作,例如sample(df[df$gender == \"M\", numrows)其中 numrows 是您要保留的行数,例如你的例子中女性观察的数量。
标签: r