【发布时间】:2020-12-19 04:06:02
【问题描述】:
我正在尝试根据 R 中的特定条件排除某些列。我的数据是一个包含 5000 行和 1000 列的大矩阵。看起来是这样的:
我想排除每月平均观察次数少于 100 次的所有列。我尝试了一个 for 循环,但它返回一个空值。
【问题讨论】:
-
Eli,请提供一种方法让我们重现您的数据,您可以在您的 R 对象上使用 dput() 函数,然后将结果复制并粘贴到这篇文章中。
-
请使用
dput添加数据,而不是图像。还显示相同的预期输出。请阅读有关how to ask a good question 的信息以及如何提供reproducible example。您可以创建一个小示例,其中有 5-8 列,而不是 100 个观察值,我们可以保留只有 3-4 个观察值的列。 -
colSums(is.na(
)) 将告诉您每列有多少个 NA .. 您使用此布尔值对矩阵进行子集化?例如, [,colSums(is.na( )) -
@StupidWolf 非常感谢!效果很好!
-
太好了。下次尝试像@RonakShah 指出的那样提供您的数据示例。