【发布时间】:2015-12-27 20:18:51
【问题描述】:
我有大量的时间序列数据,我在更改时间约定时遇到了问题。
以下是不同的类型,我正在尝试将它们全部变成一种格式。无法找到任何相应的指导。它更像是我正在尝试做的数据预处理/清理过程。让python和pandas的下一个执行过程顺利进行。手动更改几乎是不可能的,需要使用 python 脚本修复。
输入文件有两种CSV 格式。
三列多行,其中col[0] 绝对是日期时间,其余的是其他数据。列标题不是恒定的,每个输入文件都有一些名称,因此不能使用标题。
09/30/2015 12:00 PM,abcsd,434235
09/30/2015 12:30 PM,taer,45824
09/30/2015 13:00 PM,hshfe,4894
多列多行的输入文件
no.,30-09-2015 12:00 PM,30-09-2015 13:00 PM
1111,2345,2342
类型
1. 09/30/2015 12:00:00
2. 30/09/2015 12:00
3. 09/30/2015 12:00 PM
4. 30/09/2015 12:00 PM
5. 30-09-2015 12:00:00
6. 30-09-2015 12:00 PM
上面列出的是类型,我想将它们全部归为一种格式:
1. 30/09/2015 12:00
or
2. 09/30/2015 12:00
我也无法在文档中找到适当的指导。所以到目前为止无法尝试任何代码。
感谢您的宝贵建议
【问题讨论】:
-
它已经是熊猫专栏了吗?
Types是什么? -
dd-mm与mm-dd如果当天少于 13 点,将是模棱两可的。您希望如何处理? -
@tzaman 做了一些编辑并改进了解释。是的,我确实希望检查当前时间,以便处理模棱两可的情况。
标签: python datetime date-formatting data-cleaning pandas-datareader