【发布时间】:2021-01-25 02:00:37
【问题描述】:
我只是在学习一些数据分析的基础知识。
我有一个简单的 csv 数据文件,如下所示。
START,FIRST,SECOND,ITEM
1,100,200,A
2,100,200,B
2,100,300,C
2,200,300,D
3,200,100,E
3,200,100,F
3,200,100,G
3,200,100,H
3,200,100,I
3,200,100,J
我编写了这个小程序来读取这个 csv 文件,然后使用 matplotlib 为 START、FIRST 和 SECOND 三列打印直方图。我还打印了 FIRST 与 SECOND 列的散点图。
#!/exp/anaconda3/bin/python3
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
file_name = 'junk.csv'
data = pd.read_csv(file_name)
print(data.describe())
plt.rcParams['axes.grid'] = True
fix, axs = plt.subplots(2,2, figsize=(15,10))
axs[0, 0].hist(data['START'], 100, density=True, facecolor='g', alpha=0.8)
axs[1, 0].scatter(data['FIRST'], data['SECOND'], facecolor='violet')
axs[0, 1].hist(data['FIRST'], 100, density=True, facecolor='r', alpha=0.8)
axs[1, 1].hist(data['SECOND'], 100, density=True, facecolor='b', alpha=0.8)
plt.show()
我不明白的是在直方图中,例如,附图中右下角带有蓝色条的图像,为什么它不简单地绘制数字 200 出现的次数而不是显示 200 出现0.10 倍。这怎么可能? 300 也一样。
有人可以帮助我了解 matplot 是什么以及如何得出 Y 轴值的吗?这些值对我来说没有意义。
谢谢。
鲁比·德鲁
【问题讨论】:
标签: python pandas matplotlib histogram