【发布时间】:2011-02-10 21:52:51
【问题描述】:
我有一些大型数据集(数字和文本),当我正在研究并使用 python 和 numpy/matplotlib 进行可视化时,我遇到了一个问题:我加载原始数据,应用计算,然后创建图表在 matplotlib 中。这一切都在一个程序中,因此每次我想要调整图表图例或使我的图表在视觉上更具吸引力时,我都会冗余且低效地计算相同的数据。我只处理我的数据集的一小部分样本,脚本一次运行 30 分钟!
我知道解决方案是运行计算并将输出存储在单独的程序中使用;然后使用不同的程序来生成实际的图表。我的问题是我不知道如何最好地在程序之间存储处理过的数据。我应该制作一个 .csv 文件,还是有一些合适的结构可以自动以(可能)人类可读的格式存储数据?
【问题讨论】: