【问题标题】:How do I create a pie chart using categorical data in matplotlib?如何使用 matplotlib 中的分类数据创建饼图?
【发布时间】:2020-09-01 12:34:49
【问题描述】:

我的数据如下:

ID  Gender  Country  ...
1   Male    UK
2   Female  US
3   Male    NZ
4   Female  UK
...

只有 2 个性别选项和 3 个国家选项。我想为“性别”和“国家”创建一个单独的饼图,以显示每个选项在数据中出现的次数,但我对如何做到这一点感到很困惑。

数据存储在 pandas 数据框中。

非常感谢任何和所有帮助!

【问题讨论】:

  • 你的数据是一种什么样的数据结构?
  • 它存储在 pandas 数据帧中

标签: python pandas matplotlib pie-chart


【解决方案1】:

这是一种使用pandas的方法:

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt

def label_function(val):
    return f'{val / 100 * len(df):.0f}\n{val:.0f}%'

N = 50
df = pd.DataFrame({'country': np.random.choice(['UK', 'US', 'NZ'], N),
                   'gender': np.random.choice(['Male', 'Female'], N)})

fig, (ax1, ax2) = plt.subplots(ncols=2, figsize=(10, 5))

df.groupby('country').size().plot(kind='pie', autopct=label_function, textprops={'fontsize': 20},
                                  colors=['tomato', 'gold', 'skyblue'], ax=ax1)
df.groupby('gender').size().plot(kind='pie', autopct=label_function, textprops={'fontsize': 20},
                                 colors=['violet', 'lime'], ax=ax2)
ax1.set_ylabel('Per country', size=22)
ax2.set_ylabel('Per gender', size=22)plt.tight_layout()
plt.show()

PS:要只显示百分比,请使用autopct='%1.0f%%'

【讨论】:

  • 非常感谢!是否还有向图表添加数据标签,以便它们在图表上也显示数量/百分比?
【解决方案2】:

我假设你是从这个开始的

import pandas as pd
from matplotlib.pyplot import pie, axis, show

df = pd.DataFrame([[1,'Male','UK'],   [2, 'Female', 'NZ'],    [3, 'Male', 'UK'], [4, 'Male', 'US']], columns=['ID',  'Gender',  'Country'])

按性别绘制

df.groupby('gender').size().plot(kind='pie', autopct='%.2f')

国家图

df.groupby('country').size().plot(kind='pie', autopct='%.2f')

【讨论】:

    【解决方案3】:

    好的,既然您正在使用这样的数据框:

    data = pd.DataFrame([[1,'Male','UK'],   [2, 'Female', 'NZ'],    [3, 'Male', 'UK'], [4, 'Male', 'US']], columns=['ID',  'Gender',  'Country'])
    

    你真的可以这样做:

    data['Gender'].value_counts().plot(kind='pie')
    

    如果您想手动操作:

    people = len(data.Gender)
    genders = len(set(data.Gender))
    
    res = []
    for gender in set(data.Gender):
        res.append([gender, len(data[data['Gender']==gender]), len(data[data['Gender']==gender])/people])
    

    然后画出来。

    【讨论】:

    • 非常感谢!是否还有向图表添加数据标签,以便它们在图表上也显示数量/百分比?
    猜你喜欢
    • 1970-01-01
    • 2023-03-14
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多