【发布时间】:2016-07-30 05:48:12
【问题描述】:
我有一组调查回复,我正在尝试使用 pandas 进行分析。我的目标是找到(对于这个例子)美国每个县最常见的性别,所以我使用以下代码:
import pandas as pd
from scipy import stats
file['sex'].groupby(file['county']).agg([('modeSex', stats.mode)])
输出是:
我怎样才能解压这个只得到模式值,而不是第二个值,告诉模式发生的频率?
这是数据框的示例:
county|sex
----------
079 | 1
----------
079 | 2
----------
079 | 2
----------
075 | 1
----------
075 | 1
----------
075 | 1
----------
075 | 2
期望的输出是:
county|modeSex
----------
079 | 2
----------
075 | 1
【问题讨论】:
标签: python python-3.x pandas scipy