项目所需的基本 Rscript 帮助[关闭]答案

【问题标题】：Basic Rscript help needed for project [closed]项目所需的基本 Rscript 帮助[关闭]
【发布时间】：2020-08-17 02:37:58
【问题描述】：

大家好，我正在做一个统计项目，需要帮助。我有一个数据集，我试图找出哪个县的平均体重最高，哪个县的平均体重最低。我可以使用什么命令来找到每个县的平均重量。我掌握的所有信息都是数据集中每个人的权重和县。

【问题讨论】：

参见help('mean')、help('min') 和help('which.min')。 max 也是如此。
了解您的数据在 R 中的结构非常重要。可能，帖子“stackoverflow.com/questions/21982987/…”会回答您的问题。如果没有，请让我们一睹您的数据的样子。例如。您可以使用head(df) 打印数据框中的顶部元素，以便我们更清楚地了解您的需求。
嘿，我尝试使用 head(df) 并得到函数 (x, df1, df2, ncp, log = FALSE) 2 { 3 if (missing(ncp)) 4 .Call(C_df, x , df1, df2, log) 5 else .Call(C_dnf, x, df1, df2, ncp, log) 我不太清楚这是什么意思。另一篇文章使用了一个我不熟悉的聚合函数，并且知道我们没有被教过，所以我不习惯使用它。谢谢
存储您的数据的对象的名称是什么？这是 head-function 所需的参数。所以选择head( [MyDataSet] )。

标签： r statistics rscript

【解决方案1】：

你能显示一些数据吗？我想你的看起来像

| County | Person | Weight |
|--------|--------|--------|
| A      | Joe    | 76     |
| A      | Mary   | 68     |
| A      | Lucy   | 59     |
| B      | Carlos | 60     |
| B      | Lucas  | 80     |
| B      | Lola   | 50     |
| C      | Pierre | 70     |
| C      | Xavier | 89     |
| C      | Simone | 56     |

如果是这种情况，我会像这样使用aggregate 函数

df_ag <- aggregate(df[,3], list(df$County), mean) #being df the name of your dataframe you want to aggregate, by df$County if you want to aggregate by County and then mean if you want to apply the mean formula

这使您成为一个新的数据框“df_ag”，您可以使用它进行排序

df_ag <- df_ag[order(df_ag$County),]

按均值的升序对新数据框进行排序（如果您想要降序，可以将“-”添加到要排序的变量中）。最后，您可以使用head(df_ag) 获得较高的平均值，使用tail(df_ag) 获得较低的观察值（或者如果您按降序对其进行排序，则相反。

您可以查看https://www.statmethods.net/management/sorting.html、http://rfunction.com/archives/699和Mean per group in a data.frame

【讨论】：