【发布时间】:2012-10-09 02:02:12
【问题描述】:
我有一个类似这样的数据集(显示第一行):
Sample Detector Cq
P_1 106 23.53152
P_1 106 23.152458
P_1 106 23.685083
P_1 135 24.465698
P_1 135 23.86892
P_1 135 23.723469
P_1 17 22.524242
P_1 17 20.658733
P_1 17 21.146122
“Sample”和“Detector”列都包含重复值(“Cq”是唯一的):准确地说,每个“Detector”对于每个样本出现 3 次,因为它是数据中的重复。
我需要做的是:
- 重塑表格,使列包含样本和行检测器
- 重命名重复的列,以便我知道它是哪个副本
我认为DataFrame.pivot 可以解决问题,但由于数据重复而失败。最好的方法是什么?重命名重复项,然后重新整形,还是有更好的选择?
编辑:我仔细考虑过,我认为最好说明目的。我需要为每个“样本”存储其“检测器”的平均值和标准偏差。
【问题讨论】: