【发布时间】:2020-03-13 15:43:39
【问题描述】:
我的任务如下:我需要从头开始以数据框的形式构建几个表。特别是,对于每个标识符,每个表总是相同的(一种汇总统计表)。例如:
result= {'Value':[mean_t,mean_t_1,mean_diff_lev, mean_diff_log],
'T-stat':[np.NaN,np.NaN,t_diff_lev, t_diff_log],
'Type':['XL','XL','XL', 'XL']}
result=pd.DataFrame.from_dict(result,orient='index',
columns=['Square_t','Square_t_1',
'Mean diff','Mean diff log'])
结果给了我这个:
Square_t Square_t_1 Mean diff Mean diff log
Value 502.123 533.324 -31.2018 -0.0567523
T-stat NaN NaN -3.33098 -5.38749
Type XL XL XL XL
我有一个函数可以计算那里使用的所有值,最后它从值字典创建上面给出的数据框。我需要能够设置一个由两个组件组成的多索引:第一个(或外部)一个是标识符(比如“Roger”),第二个(或内部)是由我已经拥有的,即列表@ 987654323@。结果应如下所示:
Square_t Square_t_1 Mean diff Mean diff log
Roger Value 502.123 533.324 -31.2018 -0.0567523
T-stat NaN NaN -3.33098 -5.38749
Type XL XL XL XL
或者这个:
ID Var Square_t Square_t_1 Mean diff Mean diff log
Roger Value 502.123 533.324 -31.2018 -0.0567523
T-stat NaN NaN -3.33098 -5.38749
Type XL XL XL XL
然后,目标是能够通过附加或连接具有不同 ID 的不同数据帧来构建更大的数据帧。
【问题讨论】:
标签: dataframe indexing multi-index