【问题标题】:Using mask to filter dataframe by multiple day of week使用掩码按一周中的多天过滤数据帧
【发布时间】:2020-07-24 06:15:37
【问题描述】:

我正在尝试使用掩码来过滤和显示我感兴趣的日期。这是我当前的代码:

# mask date range 
start_date = '2019-10-01'
end_date = '2019-11-01'
mask1 = (df['StartTime'] >= start_date) & (df['StartTime'] < end_date)

# mask dayofweek
mask2 = (df.StartTime.dt.dayofweek == 0)

mask = mask1 & mask2

#apply mask
df.loc[mask]

上面的代码显示了 mask2 dayofweek(0 = 星期一)的 mask1 日期范围(2019-10-01 到 2019-11-01)内的所有日期。 不过我对周一到周四有兴趣,所以需要调整 mask2。

以下是我尝试过的一些事情:

#this doesn't work:
mask2 = (0<=df.StartTime.dt.dayofweek<=3)

#this doesn't work:
mask2 = (df.StartTime.dt.dayofweek == 0) or (df.StartTime.dt.dayofweek == 1) or (df.StartTime.dt.dayofweek == 2) or (df.StartTime.dt.dayofweek == 3)

您能告诉我最好的方法是什么吗?提前谢谢你。

【问题讨论】:

标签: python pandas date filter mask


【解决方案1】:

一种方法是提取dayofweek,然后使用isin

例如:

df = pd.DataFrame({
    "StartTime" : ['2019-10-01', '2019-10-02', '2019-10-03', '2019-10-04', '2019-10-05', '2019-10-06', '2019-10-07', '2019-10-08']
})
df["StartTime"] = pd.to_datetime(df["StartTime"], format="%Y-%m-%d")
df["dayofweek"] = df["StartTime"].dt.dayofweek

print(df[df["dayofweek"].isin([0,1,2])]['StartTime'])

输出:

0   2019-10-01
1   2019-10-02
6   2019-10-07
7   2019-10-08
Name: StartTime, dtype: datetime64[ns]

【讨论】:

  • 谢谢!我能够使用这个:mask2 = df.StartTime.dt.dayofweek.isin([0,1,2,3])
猜你喜欢
  • 2019-10-24
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多