【问题标题】:Plotting CSV rows/columns simpler on Python在 Python 上更简单地绘制 CSV 行/列
【发布时间】:2017-09-15 16:10:42
【问题描述】:

我有一个 csv 文件正在尝试读取。 excel/csv 表中的第一行是列标题“Jan|Feb|Mar...”等。然后每个列标题下方是浮点数据。我有以下代码:

filename ='Data.csv'
with open(filename) as f:
csvreader = csv.reader(f)
header_row = next(csvreader)
Jan, Feb = [], [] .... #(and so on)
Mar = []
Apr = []
May = []
Jun = []
Jul = []
Aug = []
Sep = []    
Oct = []
Nov = []
Dec = []
for row in csvreader:
    Jan.append(float(row[1]))
    Feb.append(float(row[2]))
    Mar.append(float(row[3]))
    Apr.append(float(row[4]))
    May.append(float(row[5]))
    Jun.append(float(row[6]))
    Jul.append(float(row[7]))
    Aug.append(float(row[8]))
    Sep.append(float(row[9]))
    Oct.append(float(row[10]))
    Nov.append(float(row[11]))
    Dec.append(float(row[12]))

如何压缩此代码,以便轻松绘制条形图,其中 x 轴为月份,y 轴为数据?

【问题讨论】:

标签: python csv matplotlib bar-chart reader


【解决方案1】:

对我来说,最简单的方法是使用 pandas 库,因为它直接从数据框中提供绘图功能。

import pandas as pd

df = pd.read_csv('Data.csv', sep='|') # or your sep in file
...
df.plot.bar()

编辑: 如果您在 excel 中有数据,则无需像 csv 文件那样提供 sep。 读取excel文件很简单:

df = pd.read_excel('Data.xlsx', sheetname='name')
df.plot.bar()

http://pandas.pydata.org/pandas-docs/version/0.20/generated/pandas.read_excel.html

一些例子:

df2 = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df2.plot.bar()

barplot 的 Pandas 文档: https://pandas.pydata.org/pandas-docs/stable/visualization.html#visualization-barplot

【讨论】:

  • The best way .. 似乎很主观,为什么它比使用csv 模块更好?
  • 对不起,我编辑了主观部分...,这是因为您使用一个包从数据框接口读取文件,清理文件和绘图文件
  • 我还在学习 Python,但到目前为止我还不是 pandas 的粉丝。 “sep”命令有什么作用。我在 excel 中的文件,我正在使用 |只是为了显示月份在不同的列中。
  • @Jonathon sep 用于 csv,读取 excel 你不需要它。相反,您使用 pd.read_excel() - 请参阅编辑
  • 你是对的。在这种情况下,Pandas 似乎确实更容易。读入数据后,如何将列隔离为 x,y 变量以便绘制它们?
【解决方案2】:

假数据/设置:

import csv, io
from pprint import pprint
from matplotlib import pyplot as plt

s = '''a, b, c
1, 2, 3
4, 5, 6
7, 8, 9'''
csv_file = io.StringIO(s)
reader = csv.reader(csv_file)

csv.reader 对象返回行

header = next(reader)
data_rows = list(reader)

>>> pprint(data_rows, width = 20)
[['1', ' 2', ' 3'],
 ['4', ' 5', ' 6'],
 ['7', ' 8', ' 9']]
>>>

您可以使用zip() 将数据转置为列

data_cols = zip(*data_rows)

>>> pprint(list(data_cols), width = 20)
[('1', '4', '7'),
 (' 2', ' 5', ' 8'),
 (' 3', ' 6', ' 9')]
>>> 

您可以再次使用 zip 将列与其标题相关联,并在绘图中添加图例

for month, data in zip(header, data_cols):
    plt.plot(data, label = month)
plt.legend()
plt.show()
plt.close()


如果您只想将数据放入容器并让列与其标题相关联,请将其放入字典中:

data = {}
for month, column in zip(header, data_cols):
    data[month] = column

>>> data
{'a': ('1', '4', '7'), ' b': (' 2', ' 5', ' 8'), ' c': (' 3', ' 6', ' 9')}
>>>

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2016-07-04
    • 2019-03-23
    • 1970-01-01
    • 2013-10-09
    • 2021-07-08
    • 1970-01-01
    • 2019-03-25
    • 1970-01-01
    相关资源
    最近更新 更多