【发布时间】:2017-09-17 02:37:00
【问题描述】:
我正在尝试找出一种基于行标识符执行数学运算的优化方法。
样本数据集如下:
A B C D E F G H I J K
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
1 1 2 1 1 2 1 2 1 1 2
1 1 2 1 1 2 1 2 1 1 2
1 1 2 1 1 2 1 2 1 1 2
1 1 2 1 1 2 1 2 1 1 2
2 1 2 1 1 2 1 2 1 1 2
2 1 2 1 1 2 1 2 1 1 2
2 1 2 1 1 2 1 2 1 1 2
2 1 2 1 1 2 1 2 1 1 2
3 1 2 1 1 2 1 2 1 1 2
3 1 2 1 1 2 1 2 1 1 2
3 1 2 1 1 2 1 2 1 1 2
3 1 2 1 1 2 1 2 1 1 2
4 1 2 1 1 2 1 2 1 1 2
4 1 2 1 1 2 1 2 1 1 2
4 1 2 1 1 2 1 2 1 1 2
4 1 2 1 1 2 1 2 1 1 2
我想根据A 列查找行的总和。因此,最终输出将有四行:
A B C D E F G H I J K
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
1 4 8 4 8 4 8 4 8 4 8
2 4 8 4 8 4 8 4 8 4 8
3 4 8 4 8 4 8 4 8 4 8
4 4 8 4 8 4 8 4 8 4 8
因为,真实的数据集很大。我无法清楚地思考如何遍历所有数据集并完成所需的操作。上面的sum只是一个例子,我会做更复杂的操作。关键是根据行键对数据进行子集化,然后执行操作,存储,然后一直这样做,直到到达最后一个行键。
任何建议都会有所帮助,谢谢。
【问题讨论】:
标签: r dataframe subset summary