【发布时间】:2020-12-05 13:34:43
【问题描述】:
我目前正在研究气候数据集,有两个主要问题我无法解决。
数据 = https://ufile.io/u2dszh4x
-
有没有办法在对应的列之前融化季节字段,使其产生类似https://imgur.com/dF3gNY0 我想在季节列中生成一个名为“grow”的新类,其中包含 ppt 和春季和夏季月份的所有其他参数的平均值。我最初试图将 prism_grouped 与一年的列和其他列和个人观察,即(spring_ppt_mm,summer_ppt_mm,fall_ppt_mm,winter_ppt_mm,...)并使用 mutate 从那里计算它,但融化和收集数据总是让我很不稳定结果。
-
当我尝试计算每个赛季的 z 分数时,当我使用这种方法时,我会在输出数据库中填充 NaN:
弹簧 %
过滤器(季节==“春天”)%>%
变异(z_ppt_mm = scale(ppt_mm)) %>%
变异(z_tmin_c = scale(tmin_c)) %>%
变异(z_tmean_c = scale(tmean_c)) %>%
变异(z_tmax_c = scale(tmax_c)) %>%
变异(z_vdpmin_hpa = scale(vdpmin_hpa)) %>%
变异(z_vdpmax_hpa = scale(vdpmax_hpa))
但如果我执行以下操作会得到有效结果:
spring <- filter(prism_grouped,season == "spring")
z_spr_ppt <- scale(spring$ppt_mm)
z_spr_tmin <- scale(spring$tmin_c)
z_spr_tmean <- scale(spring$tmean_c)
z_spr_tmax <- scale(spring$tmax_c)
z_spr_vdpmin <- scale(spring$vdpmin_hpa)
z_spr_vdpmax <- scale(spring$vdpmax_hpa)
我目前可以使用第二种方法,但我正在尝试减少我正在使用的变量的数量,并且希望将它们包含在数据框中。任何建议将不胜感激!
【问题讨论】: