【问题标题】:Filter a dataframe by different timestamp formats按不同的时间戳格式过滤数据帧
【发布时间】:2020-06-12 09:58:58
【问题描述】:

例如,我有一个带有时间戳功能的数据框,它有两种不同的格式

created                     name
2020-04-30T20:06:00.000Z    Back
--T::00.000Z                Summary
2020-04-30T20:05:00.000Z    Recalculate
2020-04-30T20:05:00.000Z    Recalculate
--T::00.000Z                Recalculate

我想过滤此数据帧,以便仅获取格式良好的时间戳 'yyyy-mm-ddTHH:MM:SS.000Z',即获取数据帧

created                     name
2020-04-30T20:06:00.000Z    Back
2020-04-30T20:05:00.000Z    Recalculate
2020-04-30T20:05:00.000Z    Recalculate

如何按时间戳格式过滤?

【问题讨论】:

    标签: pandas dataframe timestamp


    【解决方案1】:

    使用pd.to_datetime 和可选参数errors=coercecreated 列转换为一系列pandas 日期时间,然后使用Series.notna 创建布尔掩码并使用此掩码过滤数据框:

    m = pd.to_datetime(df['created'], errors='coerce').notna()
    df = df[m]
    

    # print(df)
                        created         name
    0  2020-04-30T20:06:00.000Z         Back
    2  2020-04-30T20:05:00.000Z  Recalculate
    3  2020-04-30T20:05:00.000Z  Recalculate
    

    【讨论】:

      猜你喜欢
      • 2019-01-03
      • 2020-06-17
      • 2015-06-20
      • 2021-07-09
      • 2022-11-30
      • 2017-09-08
      • 2016-05-05
      • 1970-01-01
      • 2021-05-07
      相关资源
      最近更新 更多