【发布时间】:2018-07-19 17:26:49
【问题描述】:
我有一个数据框“region_group”。如下所示,此数据框在“Town/City”列中没有“ARTHOG”值。但是,当我首先在此列上执行 groupby-first 时,此值会重新出现。我试图了解为什么会发生这种情况。
注意:region_group 数据框基于另一个数据框,该数据框在“Town/City”列中具有“ARTHOG”作为值。但是它已经被过滤掉了,如下所示,在 Out[25] 中也很明显
region=k[['my_ID','Town/City','District','County','month','year']]
region=region.loc[(region['month'] == 12) & (region['year'] == 2016)]
region_noid=region.drop(['my_ID','month','year'], axis=1)
region_group=region_noid.groupby(['Town/City','District','County']).size().reset_index(name='Count')
【问题讨论】:
-
dtype是您的“城镇/城市”列吗?只是排除了分类。 -
不,它是分类数据类型。
-
region_group.dtypes Out[29]: Town/City category District category County category Count int64 dtype: object