【发布时间】:2018-06-11 13:50:18
【问题描述】:
我有大约 600 个 csv 文件数据集,都有相同的列名 ['DateTime'、'Actual'、'Consensus'、'Previous'、'Revised']、所有经济指标和所有时间序列数据集.
目的是将它们全部合并到一个 csv 文件中。
以“日期时间”为索引。
我希望此文件索引的方式是时间线方式,这意味着假设第一个 csv 中的第一个事件日期为 2017 年 12 月 18 日 10:00:00,第二个 csv 中的第一个事件日期为 12 /29/2017 09:00:00 和第三个 csv 中的第一个事件日期为 2017 年 12 月 20 日 09:00:00。
所以,我想先索引它们,然后再索引它们,等等。尽管它最初来自源 csv。
我尝试仅合并其中的 3 个作为实验,问题是“DateTime”,因为它像这样将它们中的 3 个打印在一起('12/18/2017 10:00:00', '12/29 /2017 09:00:00','12/20/2017 09:00:00') 代码如下:
import pandas as pd
df1 = pd.read_csv("E:\Business\Economic Indicators\Consumer Price Index - Core (YoY) - European Monetary Union.csv")
df2 = pd.read_csv("E:\Business\Economic Indicators\Private loans (YoY) - European Monetary Union.csv")
df3 = pd.read_csv("E:\Business\Economic Indicators\Current Account s.a - European Monetary Union.csv")
df = pd.concat([df1, df2, df3], axis=1, join='inner')
df.set_index('DateTime', inplace=True)
print(df.head())
df.to_csv('df.csv')
【问题讨论】:
-
你能举一个输入输出的例子吗?
标签: python pandas csv datetime