【发布时间】:2015-03-23 19:02:29
【问题描述】:
我正在使用如下所示的数据框。我想看起来像:
省:区:A党得票:A党百分比:B党得票:B党百分比:C党得票:C党百分比
现在候选名称作为唯一标识符运行良好,以避免需要聚合函数,但我最终会放弃它。
candidate<-c('bob jones', 'bobby jones', 'sara jones', 'sara norah', 'nora jones', 'other name', 'name other', 'thomas name', 'name judge', 'my mayor', 'peter peter', 'paul paul')
party<-rep(c('A', 'B', 'C'), 4)
district<-c(rep('District 1', 3), rep('District 2', 3), rep('District 3', 3), rep('Disctrict 4', 3))
province<-c(rep('Province 1', 3), rep('Province 2', 3), rep('Province 3', 3), rep('Province 4', 3))
votes<-round(rnorm(12, mean=5000, sd=1000),0)
percent<-round(rnorm(12, mean=37, sd=10),2)
df<-data.frame(party, district,province, votes, percent, candidate)
我正在使用这些命令
df.test<-melt(df, id.vars=c('candidate', 'province', 'district', 'party'))
dcast(df.test, candidate+province+district~variable+party, value.var=c('value'))
很接近,不是每个区创建一行,而是每个区创建四行。问题是:在我的示例数据集中,当我从我的选角电话中删除“候选人”时,这个示例数据集效果很好,例如
dcast(df.test, district~variable+party, value.var=c('value'))
但是当我在我的数据集中使用相同的调用时,我不再拥有唯一标识符,并且它会按长度聚合。
希望您能提供帮助。谢谢。
【问题讨论】: