【问题标题】:Basic Rscript help needed for project [closed]项目所需的基本 Rscript 帮助[关闭]
【发布时间】:2020-08-17 02:37:58
【问题描述】:

大家好,我正在做一个统计项目,需要帮助。我有一个数据集,我试图找出哪个县的平均体重最高,哪个县的平均体重最低。我可以使用什么命令来找到每个县的平均重量。我掌握的所有信息都是数据集中每个人的权重和县。

【问题讨论】:

  • 参见help('mean')help('min')help('which.min')max 也是如此。
  • 了解您的数据在 R 中的结构非常重要。可能,帖子“stackoverflow.com/questions/21982987/…”会回答您的问题。如果没有,请让我们一睹您的数据的样子。例如。您可以使用head(df) 打印数据框中的顶部元素,以便我们更清楚地了解您的需求。
  • 嘿,我尝试使用 head(df) 并得到函数 (x, df1, df2, ncp, log = FALSE) 2 { 3 if (missing(ncp)) 4 .Call(C_df, x , df1, df2, log) 5 else .Call(C_dnf, x, df1, df2, ncp, log) 我不太清楚这是什么意思。另一篇文章使用了一个我不熟悉的聚合函数,并且知道我们没有被教过,所以我不习惯使用它。谢谢
  • 存储您的数据的对象的名称是什么?这是 head-function 所需的参数。所以选择head( [MyDataSet] )

标签: r statistics rscript


【解决方案1】:

你能显示一些数据吗?我想你的看起来像

| County | Person | Weight |
|--------|--------|--------|
| A      | Joe    | 76     |
| A      | Mary   | 68     |
| A      | Lucy   | 59     |
| B      | Carlos | 60     |
| B      | Lucas  | 80     |
| B      | Lola   | 50     |
| C      | Pierre | 70     |
| C      | Xavier | 89     |
| C      | Simone | 56     |

如果是这种情况,我会像这样使用aggregate 函数

df_ag <- aggregate(df[,3], list(df$County), mean) #being df the name of your dataframe you want to aggregate, by df$County if you want to aggregate by County and then mean if you want to apply the mean formula

这使您成为一个新的数据框“df_ag”,您可以使用它进行排序

df_ag <- df_ag[order(df_ag$County),]

按均值的升序对新数据框进行排序(如果您想要降序,可以将“-”添加到要排序的变量中)。最后,您可以使用head(df_ag) 获得较高的平均值,使用tail(df_ag) 获得较低的观察值(或者如果您按降序对其进行排序,则相反。

您可以查看https://www.statmethods.net/management/sorting.htmlhttp://rfunction.com/archives/699Mean per group in a data.frame

【讨论】:

    猜你喜欢
    • 2012-08-07
    • 2011-03-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-07-12
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多