【问题标题】:Question regarding sns.barplot and how it works?关于 sns.barplot 及其工作原理的问题?
【发布时间】:2019-05-19 01:54:49
【问题描述】:

在泰坦尼克号数据集中,如果我绘制 'survived' 和 'pclass'

两者都是分类的 幸存的包含“0”或“1” pclass 包含“1”、“2”或“3”

现在当我绘制 x='survived 和 y='pclass'

我明白了这个情节

sns.barplot(x='pclass',y='survived',data=titanic_df)

按等级分组的乘客的生存情况:

现在它是如何绘制分类变量(0 或 1)的幸存变量? 为什么y轴的范围是0到0.7?

【问题讨论】:

  • 您正在查看每个班级的平均存活率。也就是说,特定类的所有01 的平均值。

标签: python matplotlib bar-chart seaborn data-analysis


【解决方案1】:

您正在计算的是每个 Pclass 的人生存机会,例如在您的情节中,Pclass 1(1 类)的人具有更高的生存概率。

【讨论】:

    【解决方案2】:

    是因为seaborn的barplot显示的是平均值。一列数据全0或1的平均值是多少?1的百分比。

    查看文档:https://seaborn.pydata.org/generated/seaborn.barplot.html 它说“同样重要的是要记住,条形图只显示平均值(或其他估计值),......”

    最好的问候。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2012-08-31
      • 1970-01-01
      • 1970-01-01
      • 2021-07-07
      • 1970-01-01
      • 2012-03-23
      相关资源
      最近更新 更多