【发布时间】:2017-04-05 01:09:29
【问题描述】:
我最初的问题已发布here。我有一个如下的数据框:
ID START END SEQ
1 11 12 1
1 14 15 3
1 13 14 2
2 10 14 1
3 11 15 1
3 16 17 2
我想把它转换成这个DataFrame:
ID START_1 END_1 SEQ_1 START_2 END_2 SEQ_2 START_3 END_3 SEQ_3
1 11 12 1 13 14 2 14 15 3
2 10 14 1 NA NA NA NA NA NA
3 11 15 1 16 17 2 NA NA NA
pivot_table 转换后,我收到了一个 DataFrame,它在标题之后有一个额外的空白行:
test_2['SEQ1'] = test_2.SEQ
test_2 = test_2.pivot_table(index= ['ID','SEQ1']).unstack()
test_2 = test_2.sort_index(axis=1, level=1)
test_2.columns = ['_'.join((col[0], str(col[1]))) for col in test_2]
test_2
test_2
START_1 END_1 SEQ_1 START_2 END_2 SEQ_2 START_3 END_3 SEQ_3
ID
1 11 12 1 13 14 2 14 15 3
2 10 14 1 NA NA NA NA NA NA
3 11 15 1 16 17 2 NA NA NA
如何删除这些行并对齐所有标题?我尝试使用test2[:2] 以传统方式删除该行,但它没有删除空白行。
编辑:
这是更真实的数据集的提取:
ID INDEX START END SEQ NUM_PREV NUM_ACTUAL NUM_NEXT TIME PRE_TIME LOC_IND
079C 333334.0 2016-06-23 12:45:32 2016-06-23 12:51:05 1 1 23456 25456 29456 30 2 YES
079C 333334.0 2016-06-23 12:47:05 2016-06-23 12:51:05 2 2 29456 39458 39945 20 0 NO
【问题讨论】:
标签: python python-2.7 pandas