【问题标题】:pandas resample dealing with missing data处理缺失数据的熊猫重采样
【发布时间】:2014-08-06 15:40:32
【问题描述】:

我正在使用 pandas 来处理具有一些缺失值的月度数据。我希望能够使用重采样方法来计算年度统计数据,但多年来没有丢失数据。

这里有一些代码和输出来演示:

import pandas as pd
import numpy as np
dates = pd.date_range(start = '1980-01', periods = 24,freq='M')
df = pd.DataFrame( [np.nan] * 10 + range(14), index = dates)

这是我重新采样后得到的结果:

In [18]: df.resample('A')
Out[18]: 
          0
1980-12-31  0.5
1981-12-31  7.5

我想为 1980-12-31 指数提供一个 np.nan,因为那一年没有每个月的月度值。我尝试使用“如何”的论点,但没有成功。

我怎样才能做到这一点?

【问题讨论】:

    标签: python pandas


    【解决方案1】:

    我确信有更好的方法,但在这种情况下你可以使用:

    df.resample('A', how=[np.mean, pd.Series.count, len])
    

    然后删除count != len所在的所有行

    【讨论】:

    • 我会调查的。谢谢。
    猜你喜欢
    • 2018-01-17
    • 1970-01-01
    • 1970-01-01
    • 2016-08-06
    • 2016-11-25
    • 1970-01-01
    • 2017-10-09
    • 1970-01-01
    • 2018-11-16
    相关资源
    最近更新 更多