【发布时间】:2018-11-10 08:25:06
【问题描述】:
我有一些包含以下列的 csv 数据:
country, region, year, month, price, volume
我需要将其转换为以下内容:
country, region, datapoints
其中数据点由以下任一组成:
(year, month, price, volume)
元组数组,或(更好)
{
(year, month) : {price, volume}
}
实际上,我正在尝试将数据重塑为时间序列,然后可以将其存储为镶木地板。对于它的价值,我正在使用 fastparquet 将数据帧写入 parquet 文件。
这可能吗?
【问题讨论】:
-
只是一个观察,你写的更好的数据点格式不能在 Python 中工作,
{year, month}是set,它不能是字典中的键。你最终可以做(year, month)这是tuble并且可以是一个关键。 -
谢谢...是的,键需要是(年,月)元组。
标签: python pandas pandas-groupby parquet fastparquet