【发布时间】:2021-07-06 07:41:40
【问题描述】:
我一直在努力解决这个问题。我有一个 55115 x 34 的矩阵,其中第一个维度上的每个数字是一天,151 年,总共 55115 个点。
我正在尝试获取第一个维度中值的每月百分位数,因此我首先添加了一个日期列,随后将其分组为月份,尽管我无法找出获取百分位数(第 95 个)的最佳方法天数和三维(这里是 34)。所以在对月份进行分组之后,矩阵应该是 151 x 12 x 34,我想沿着第三维取第 95 个百分位数,所以理论上我的最终矩阵应该是 151 x 12。以下是我迄今为止将日期添加到数组中的内容:
dates = pd.date_range(start='1950-01-01', end='2100-12-31', freq='D') #create daily date range from 1950 to 2100
leap = [] #empty array
for each in dates:
if each.month==2 and each.day ==29: #find each leap day (feb 29)
leap.append(each)
dates = dates.drop(leap) #get rid of leap days
dates = pd.to_datetime(dates) #convert to datetime format
data = {'wind': winddata, 'time': dates} #create table with both dates and data
df = pd.DataFrame(data) #create dataframe
df.set_index('time') #index time
df.groupby(df['time'].dt.strftime('%b'))['wind'].sort_values()
这就是我必须采用的百分位数:
months = df.groupby(pd.Grouper(key='time',freq = "M")) #group each month
monthly_percentile = months.aggregate(lambda x: np.percentile(x, q = 95)) #percentile across each month
虽然,这似乎不起作用。我对其他方法持开放态度,我只是希望 a) 将 55115 x 34 数据集重新排列为月,使其为 151(年)x 365(天)x 34(集合),然后百分位数跨越月份和三维,所以我最终得到 151 x 12 的总数。如果我没有详细说明,我很乐意澄清任何事情。任何详细的回复都会非常有帮助。提前非常感谢您!
【问题讨论】:
标签: python pandas numpy time statistics