【发布时间】:2018-09-05 11:45:35
【问题描述】:
我有这样的dataframe - 每笔交易可能出现多个,并且交易与商店相关联。我想找到交易的平均价值。为此,我需要求和然后找到平均值:
#preparind dataset
txt_data = pandas.read_csv("./TestDataSource/txn.csv", sep = ';')
txt_data = txt_data.replace({',': '.'}, regex=True)
txt_data[['SALES']] = txt_data[[ 'SALES']].apply(pd.to_numeric)
len(txt_data.STORE.unique()) 这里只有 30 个独特的商店。
首先我汇总交易:
a1 = txt_data[['STORE', 'SALES', 'TXN']].groupby('TXN').sum()[['STORE', 'SALES']]
a.head()
一切似乎都很好。但后来我汇总了商店:
a2 = a1.groupby('STORE').mean()
[![enter image description here][3]][3]
但是……
list(a2.shape) - 返回 [1137, 1] 。这真是令人困惑。但此外len(a1.STORE.unique()) 返回 1137
我做错了什么
【问题讨论】:
标签: python python-3.x pandas pandas-groupby