【发布时间】:2021-03-10 14:43:51
【问题描述】:
我在每个州都有某些箱线图,它们在两个品牌之间具有统计学意义。
a4_dims = (40, 10)
fig, ax = pyplot.subplots(figsize=a4_dims)
dd=pd.melt(df_box,id_vars=['region'],value_vars=['Lowe\'s','Home Depot'],var_name='brands')
a = df_box.groupby(['region']).sum()
most_visits_order = a.assign(tmp=a.sum(axis=1)).sort_values('tmp', ascending=False).drop('tmp', 1).index.tolist()
sns.boxplot(x='region',y='value',data=dd,hue='brands',showfliers=False,order=most_visits_order)
如何突出显示或提醒我发现统计差异的州? (比如说是 TX,GA)
我尝试将其转换为 forloop 方法,以便为每个 x 手动添加它们,但效果不太好:
fig, ax = plt.subplots()
n=len(stat_sig)
fig,ax = plt.subplots(n,1, figsize=(6,n*2), sharex=True,squeeze=False)
for i in range(n):
plt.sca(ax[i])
dd=pd.melt(df_box[df_box['region']==stat_sig[i]],id_vars=['region'],value_vars=['Lowe\'s','Home Depot'],var_name='brands')
ax = sns.boxplot(x='region',y='value',data=dd,hue='brands',width=0.2)
ax.legend_.remove()
plt.show()
错误:TypeError:不可散列的类型:'numpy.ndarray'
【问题讨论】:
-
也许这篇文章会有所帮助:stackoverflow.com/questions/36305695/…
标签: python matplotlib seaborn boxplot