【发布时间】:2016-12-29 18:26:24
【问题描述】:
我想将下面的输出转换成:
删除多索引(应该只是一行索引)
相应编号为作业 1、作业生效日期 1、作业 2、作业生效日期 2,等等。
如果我选择添加或删除其他变量,我希望它具有可扩展性,我希望不必修改代码以适应它(此示例已按比例缩小)。
一些数据:
import pandas as pd
import numpy as np
data1 = {'Name': ["Joe", "Joe", "Joe","Jane","Jane"],
'Job': ["Analyst","Manager","Director","Analyst","Manager"],
'Job Eff Date': ["1/1/2015","1/1/2016","7/1/2016","1/1/2015","1/1/2016"]}
df2 = pd.DataFrame(data1, columns=['Name', 'Job', 'Job Eff Date'])
def tgrp(df):
df = df.drop('Name', axis=1)
return df.reset_index(drop=True).T
df2.groupby('Name').apply(tgrp).unstack()
【问题讨论】:
标签: python pandas dataframe group-by multi-index