【发布时间】:2015-04-22 16:20:45
【问题描述】:
我有一个这样的数据框:
0 1 2 3 4 5 6 7 8 9 Cluster
0 0.018420 0.003357 0.002626 -0.015603 -0.009005 -0.023671 -0.016316 0.066504 -0.039526 0.037820 For
1 0.017684 0.003434 -0.003338 -0.003904 -0.021871 -0.009454 -0.013772 -0.004610 -0.006150 -0.005746 For
2 0.018857 0.003987 0.001749 -0.019840 0.011184 -0.020451 0.082434 -0.008789 0.000449 0.005445 Against
3 0.020454 0.026437 0.036899 0.027168 -0.018483 -0.001076 0.005831 -0.002117 -0.011288 0.007491 For
4 0.018006 0.005365 0.001298 -0.006953 0.017034 0.006931 0.000268 0.001615 0.016707 -0.017798 Against
Df.columns
Index([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, u'Cluster'], dtype='object')
最后一列“cluster”指定观察属于“For”集群还是“Against”集群。
我想绘制一个图,以使“支持”的所有观察结果都是相同的颜色,而“反对”的所有观察结果都是相同的颜色。有 2740 个 obs,因此还需要一些线条透明度以提供更好的可视化效果。
我做了以下操作,但即使我指定颜色选项,它也会为两个类绘制相同的红色。
parallel_coordinates(Y_embed,'Cluster',color=["r" if c=="For" else "g" for c in Y_embed.Cluster])
Y_embed 是我的数据框。
如果我没有提到颜色选项,它会默认绘制两种颜色。但我想放上我自己的颜色选项。
有什么建议吗?
【问题讨论】:
标签: python numpy pandas matplotlib