【问题标题】:Extract count of single category from a pandas DataFrame从 pandas DataFrame 中提取单个类别的计数
【发布时间】:2021-06-09 07:10:35
【问题描述】:

我目前有一个 DataFrame,其中包含从一个职位发送到另一个职位的电子邮件信息。

      fromJobtitle         toJobtitle  e-mails
0              CEO                CEO       65
1              CEO           Director       23
2              CEO           Employee       56
3              CEO    In House Lawyer        7
4              CEO            Manager      104
..             ...                ...      ...
87  Vice President  Managing Director      112
88  Vice President          President      385
89  Vice President             Trader       78
90  Vice President            Unknown     1088
91  Vice President     Vice President     2304

我正在寻找一种方法,以便可以获得每个职位的总计数。 示例输出为:

        totalJobtitle       e-mails
0                 CEO           670
1   Managing Director          2341
2      Vice President          4720
3            Employee          3560
4              Trader           250

【问题讨论】:

  • 例如,如果发件人或收件人是CEO,您是否需要计算两次电子邮件?如果发送者和接收者相同怎么办?
  • 检查groupbyagg 方法得到类似的东西:df.groupby(['fromJobtitle']).agg({'e-mails':'sum'})跨度>

标签: python pandas dataframe count extract


【解决方案1】:

我可以使用的一个小例子

d = {'fromJobtitle': ["CEO", "CEO","VicePresident","VicePresident"], 'mail': [3, 4, 5, 6 ]}
df = pd.DataFrame(data=d)

df:

    fromJobtitle    mail
0   CEO 3
1   CEO 4
2   VicePresident   5
3   VicePresident   6

现在这个:

 df = pd.pivot_table(df, index=['fromJobtitle'],values=['mail'],aggfunc=np.sum)

df:

fromJobtitle    mail    
CEO 7
VicePresident   11

函数的来源: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.pivot_table.html

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2019-04-25
    • 1970-01-01
    • 2021-06-03
    • 2019-02-03
    • 2018-01-22
    • 1970-01-01
    • 2020-09-25
    相关资源
    最近更新 更多