【发布时间】:2020-08-14 19:23:07
【问题描述】:
我想使用原始 (df) 创建一个新数据框 (new.df),但使用 dplyr 包中的 mutate 函数的复杂操作创建一个新列 (Age) .我的步骤是:
# Artificial dataframe
IDtest<-c(1,1,1,1,1,1,2,2,2,3,3,3,3)
Class<-c(1,1,2,2,2,3,1,1,2,1,2,2,3)
Day<-c(0,47,76,100,150,173,0,47,76,0,47,76,100)
Area<-c(0.45,0.85,1.50,1.53,1.98,5.2,
0.36,0.58,1.2,
0.85,1.36,2.26,3.59)
df<-data.frame(cbind(IDtest, Class, Day, Area))
str(df)
#Split each IDtest
df[df[,1]==1,]
# IDtest Class Day Area
#1 1 1 0 0.45
#2 1 1 47 0.85
#3 1 2 76 1.50
#4 1 2 100 1.53
#5 1 2 150 1.98
#6 1 3 173 5.20
每个IDtest内:
- 每个
Class中的最后一个Area减去一个因子(如果面积 25 = 25);和 - 比 1) 除以最后一个和第一个
Area之间的减法运算并在每个Class内除以Day - 比 1) 和 2) 在每个
Class中求和Day减去最后一个Day。最后总和除以 365 并创建一个新列Age
#For Class 1
(0.85-0)/((0.85-0.45)/47) + (47 - 0)
#For Class 2
(1.98-1)/((1.98-0.85)/150) + (157 - 47)
#For Class 3
(5.20-3)/((5.2-1.98)/173) + (173 - 150)
#Final
Age<-((0.85-0)/((0.85-0.45)/47) + (47 - 0) +
(1.98-1)/((1.98-0.85)/150) + (157 - 47) +
(5.20-3)/((5.2-1.98)/173) + (173 - 150))/365
Age
#[1] 1.44702
# Desirable output
new.df
# IDtest Class Day Area Age
#1 1 1 0 0.45 1.44702
#2 1 1 47 0.85 1.44702
#3 1 2 76 1.50 1.44702
#4 1 2 100 1.53 1.44702
#5 1 2 150 1.98 1.44702
#6 1 3 173 5.20 1.44702
请问有什么想法吗?
【问题讨论】: