【问题标题】:How to grab a row with nearest timestamp in a pandas dataframe?如何在熊猫数据框中获取具有最近时间戳的行?
【发布时间】:2020-08-01 07:04:56
【问题描述】:

我有一个从列表中获取的时间戳,我需要在 pandas 数据框中找到最接近我拥有的时间戳的行,即使是一组行也适合我。 这是示例数据框

0 6160 Upper 12-7-2019 12:37:51.123572
1 6162 Upper 12-7-2019 12:39:22.355725
2 6175 Upper 12-7-2019 13:21:15.224157
3 6180 Upper 13-7-2019 06:04:29.157111
4 6263 Upper 13-7-2019 07:37:51.123572

我有一个时间戳 datetime.datetime(12,7,2019,16,41,20)

所以在这种情况下,我需要它在索引 2 处捕获一行。

感谢您的帮助。 谢谢

【问题讨论】:

  • 你的 datetime 对象应该是 datetime.datetime(2019,7,12,16,41,20)。参数的顺序是年、月、日、时、分、秒。请参阅Python documentation

标签: python pandas dataframe timestamp


【解决方案1】:
import pandas as pd
from datetime import datetime

# Input
ref_time = datetime(2019,7,12,16,41,20)
data = [[6160, 'Upper', '12-7-2019 12:37:51.123572'],
        [6162, 'Upper', '12-7-2019 12:39:22.355725'],
        [6175, 'Upper', '12-7-2019 13:21:15.224157'],
        [6180, 'Upper', '13-7-2019 06:04:29.157111'],
        [6263, 'Upper', '13-7-2019 07:37:51.123572']]

# Convert 2D list to DataFrame object
df = pd.DataFrame(data)

# Convert timestamp strings in column at index 2 to datetime objects
df.iloc[:, 2] = pd.to_datetime(df.iloc[:, 2], format='%d-%m-%Y %H:%M:%S.%f')

# Return row with minimum absolute time difference to reference time
print(df.loc[[(abs(df.iloc[:, 2]-ref_time)).idxmin()]])

【讨论】:

    【解决方案2】:

    你可以这样做:

    import datetime
    dt = datetime.datetime(2019, 12, 7,16,41,20)
    
    # d column is the date
    minidx = (dt - df['d']).idxmin()
    
    print(df.loc[[minidx]])
    
       a     b        c                          d
    2  2  6175   Upper  2019-12-07 13:21:15.224157
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2016-12-12
      • 1970-01-01
      • 2018-05-12
      • 2021-03-17
      • 2020-04-25
      • 1970-01-01
      • 2017-09-12
      • 2021-11-15
      相关资源
      最近更新 更多