【发布时间】:2013-04-25 04:28:14
【问题描述】:
使用by,我可以根据因子列获取所需列的统计信息。
例如,如果我想知道每个物种的 Sepal.Width/Sepal.Length 的比率,在 iris 数据框中,我会这样:
by(iris$Sepal.Width/iris$Sepal.Length, iris$Species, mean)
iris$Species: setosa
[1] 0.6842483
------------------------------------------------------------
iris$Species: versicolor
[1] 0.4676804
------------------------------------------------------------
iris$Species: virginica
[1] 0.4533956
到目前为止一切顺利。现在,问题是,我怎么能一样,但只针对一组级别。例如仅 setosa 和 versicolor?
我有一个包含数千个因素的复杂数据框。我正在玩一些表格,以便根据不同的统计数据创建因子子集。然后我想回到我原来的 data.frame 并为我想要的因子子集创建更多数字。
谢谢
【问题讨论】:
-
有很多方法可以解决这个问题,其中一些在这里概述:stackoverflow.com/a/9800266/1036500 您可能会考虑问另一个问题,这些问题显示了您实际用例的更多具体复杂性以获得更有用的答案。
标签: r