【发布时间】:2014-12-16 02:03:35
【问题描述】:
我有一个已解析的非常大的数据框,其中包含一些像这样的值和几列:
Name Age Points ...
XYZ 42 32pts ...
ABC 41 32pts ...
DEF 32 35pts
GHI 52 35pts
JHK 72 35pts
MNU 43 42pts
LKT 32 32pts
LKI 42 42pts
JHI 42 35pts
JHP 42 42pts
XXX 42 42pts
XYY 42 35pts
我已经导入了 numpy 和 matplotlib。
我需要绘制“点”列中的值出现的次数的图表。我不需要任何用于绘图的垃圾箱。因此,更多的是查看在大型数据集上出现相同分数的次数。
所以基本上条形图(或直方图,如果你可以这样称呼它)应该显示 32pts 出现三次,35pts 出现 5 次,42pts 出现 4 次。如果我可以按排序顺序绘制值,那就更好了。我试过 df.hist() 但它不适合我。 有什么线索吗?谢谢。
【问题讨论】:
-
使用
df['Points'].value_counts()的结果 -
哦。我这样做并打印值。但无法将其绘制为图形(类似于直方图)......这就是问题所在。
-
保存对象并绘制它。
-
谢谢。另外,你能说我如何从列中删除非数字字符吗?就像我想从 32pts 中删除 pts 这样它就不会像字符串一样对待它......
-
这是一个完全不同的问题。您可以在此网站上找到有关此类问题的大量资源。既然你是新来的,我会给你一根骨头,让你开始我的回答。
标签: python numpy matplotlib pandas