【问题标题】:how to merge two columns in one column as date with pandas?如何将一列中的两列合并为日期与熊猫?
【发布时间】:2020-03-05 00:37:11
【问题描述】:

我有一个 csv,第一列是日期,第五列是小时。 我想将它们合并到具有特定格式的单列中,以便编写另一个 csv 文件。

这基本上是文件:

DATE,DAY.WEEK,DUMMY.WEEKENDS.HOLIDAYS,DUMMY.MONDAY,HOUR 
01/01/2015,5,1,0,1,1,0,0,0,0,0,0,0,0,0,0,0
01/01/2015,5,1,0,2,1,0,0,0,0,0,0,0,0,0,0,0
01/01/2015,5,1,0,3,1,0,0,0,0,0,0,0,0,0,0,0
01/01/2015,5,1,0,4,1,0,0,0,0,0,0,0,0,0,0,0
01/01/2015,5,1,0,5,1,0,0,0,0,0,0,0,0,0,0,0
01/01/2015,5,1,0,6,1,0,0,0,0,0,0,0,0,0,0,0
01/01/2015,5,1,0,7,1,0,0,0,0,0,0,0,0,0,0,0
01/01/2015,5,1,0,8,1,0,0,0,0,0,0,0,0,0,0,0

我尝试将数据框读取为

dataR = pd.read_csv(fnamecsv) 

并将第一行转换为日期,如:

date_dt3 = datetime.strptime(dataR["DATE"].iloc[0], '%d/%m/%Y')

但是,在我看来,这不是正确的方法,原因有两个:

1) 它在不考虑小时列的情况下添加小时;

2) 好像没有使用 pandas 功能。

感谢您的任何帮助,

迪德罗

【问题讨论】:

    标签: pandas date merge format


    【解决方案1】:

    使用 + 运算符

    您需要在加入前将数据框元素转换为字符串。您还可以在加入期间使用不同的分隔符,例如破折号、下划线或空格。

    import pandas as pd 
    
    df = pd.DataFrame({'Last': ['something', 'you', 'want'], 
                       'First': ['merge', 'with', 'this']}) 
    
    print('Before Join') 
    print(df, '\n') 
    
    print('After join') 
    df['Name']= df["First"].astype(str) +" "+ df["Last"] 
    print(df) ```
    
    

    【讨论】:

      【解决方案2】:

      您可以使用read_csv 和参数parse_dates 以及列名列表和date_parser 指定格式:

      f = lambda x: pd.to_datetime(x, format='%d/%m/%Y %H')
      dataR = pd.read_csv(fnamecsv, parse_dates=[['DATE','HOUR']], date_parser=f)
      

      或将小时数转换为时间增量并稍后添加到日期时间:

      dataR = pd.read_csv(fnamecsv, parse_dates=[0], dayfirst=True) 
      dataR['DATE'] += pd.to_timedelta(dataR.pop('HOUR'), unit='H')
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2020-06-21
        • 1970-01-01
        • 1970-01-01
        • 2017-05-28
        • 2019-05-14
        • 1970-01-01
        • 1970-01-01
        • 2014-07-30
        相关资源
        最近更新 更多