【发布时间】:2020-08-24 13:01:10
【问题描述】:
系统: WIN10
IDE: MS Visual Studio 代码
语言: Python 3.7.3 版
库:熊猫版本 1.0.1
数据来源:在以下示例中提供
数据集:在下面的示例中提供
问:
我需要将日期和时间字符串从具有不均匀分隔符行的数据框中拆分出来,即一些带有三个逗号,一些带有四个逗号。
我试图弄清楚如何去除日期和时间值:'Nov 11 2013 12:00AM' 和 'Apr 11 2013 12:00AM' 分别从一列中这两条记录的后面移到一个新列中,如下例中的第二行逗号更少。
代码:
df['sample field'].head(2)
4457-I need, this, date, Nov 11 2013 12:00AM ,
2359-I need this, date, Apr 11 2013 12:00AM ,
虽然下面的方法将数据扩展到不同的列并错开哪一列包含日期,但这不起作用。我需要在一列中包含日期和时间(甚至只是日期)信息,以便我可以在进一步分析中使用日期值(例如时间序列)。
代码:
df['sample field'].str.split(",", expand=True)
【问题讨论】:
标签: python-3.x pandas timestamp time-series code-splitting