【发布时间】:2019-05-07 12:29:32
【问题描述】:
我需要将带有 dict 值的 dict 转换为 parquet,我的数据如下所示:
{"KEY":{"2018-12-06":250.0,"2018-12-07":234.0}}
我正在转换为 pandas 数据框,然后写入 pyarrow 表:
import pandas as pd
import pyarrow as pa
import pyarrow.parquet as pq
data = {"KEY":{"2018-12-06":250.0,"2018-12-07":234.0}}
df = pd.DataFrame.from_dict(data, orient='index')
table = pa.Table.from_pandas(df, preserve_index=False)
pq.write_table(table, 'file.parquet', flavor='spark')
我得到的数据只有日期和值,但没有字典的键。:
{"2018-12-06":250.0,"2018-12-07":234.0}
我需要的是也有数据的关键:
{"KEY": {"2018-12-06":250.0,"2018-12-07":234.0}}
【问题讨论】:
-
如果您想要保留索引,为什么要设置
preserve_index=False?
标签: python pandas dictionary dataframe pyarrow