【发布时间】:2019-02-28 00:31:32
【问题描述】:
我的数据包含一年中每一天的温度测量值以及按村庄 ID 进行分析所需的其他变量。我想创建一个新变量来计算每个村庄所有 365 次温度测量的 95 个百分位阈值。
我的数据是宽格式的,如下所示:
villageID temp1 temp2 temp3.... temp365 otherVars
1 1 70 86 98 79 x
2 2 73 89 99 86 x
3 3 71 82 96 75 x
4 4 78 79 94 81 x
5 5 90 91 89 85 x
我想创建这个 95% 阈值变量来计算阈值(或温度测量值),该阈值指示第 95 个百分位数从什么温度开始。我想在所有温度测量列[2:366] 中执行此操作,并保持所有其他变量相同。
像这样:
villageID temp1 temp2 temp3 .....temp365 otherVars 95per
1 1 70 86 98 79 x 81
2 2 73 89 99 86 x 90
3 3 71 82 96 75 x 86
4 4 78 79 94 81 x 82
5 5 90 91 89 85 x 99
【问题讨论】:
-
您不会选择使用
95per,因为那时您需要始终引用或反引号该列名。也许temp.95per,我想你的意思是说所有行,但只说某些列?