【问题标题】:day is out of range for month error suspecting its cause of leap yearday is out of range for month 错误怀疑是闰年的原因
【发布时间】:2026-01-24 06:55:02
【问题描述】:

我的代码似乎不明白有闰年。该代码适用于非闰年数据。我遇到的另一个问题是,当我打印出数据时,与实际年份相比,年份设置为 1900。

def processing(chunk): enter code here
    being read in (by chunksize)
    chunk['Date'] = pd.to_datetime(chunk['Date'], format='%Y-%m-%d') 
    chunk['Year'] = chunk['Date'].dt.year.rename('Year') #creates a new 
        column with the year
    chunk['Month'] = chunk['Date'].dt.month.rename('Month') #new column 
        with month
    chunk['Day'] = chunk['Date'].dt.day.rename('Day') #new column with day
    chunk.drop('Date', 1, inplace=True)
return;
df = pd.read_csv('NLDN_CONUS_flash_and_cloud_2012_dT4KMG.txt', 
    delim_whitespace=True, 
    names=["Date", "Time", "Latitude", "Longitude", "Current", "Multi", 
    "Type"], chunksize=2000000, nrows=2000000)


chunk_list = []
for chunk in df:
    chunk_list.append(chunk)

df_concat = pd.concat(chunk_list)
df_concat['Date'] = pd.to_datetime(df_concat['Date'], format='%Y-%m-%d')
df_concat['month-day'] = df_concat['Date'].dt.strftime('%m-%d')
df_concat['Datetime'] = df_concat['month-day'] + ' ' + df_concat['Time']
df_concat = df_concat[['Datetime', 'Latitude', 'Longitude', 'Current', 
'Multi', 'Type']]
df_concat['Datetime'] = pd.to_datetime(df_concat['Datetime'], format='%m- 
     %d %H:%M:%S.%f')
df_concat.set_index(df_concat['Datetime'], inplace=True)
print(df_concat)

ValueError: day is out of range for month

【问题讨论】:

    标签: python pandas date dataframe


    【解决方案1】:

    df_concat['Datetime'] = pd.to_datetime(df_concat['Datetime'], format='%m- 
         %d %H:%M:%S.%f')
    

    您正在转换为没有有关年份的任何信息的日期时间。所以 pandas 假定默认年份是 1900 年。

    我建议使用完整的日期时间作为索引,然后按 dayofyear 或任何需要的分组。

    【讨论】:

    • 这也能解决闰年问题吗?
    • 1900 年不是闰年。这意味着:1900 年 2 月的 29. 不存在。你的错误可能是因为这个。
    最近更新 更多