【问题标题】:Pandas, recording a continuous average熊猫,记录连续平均值
【发布时间】:2021-07-15 13:33:07
【问题描述】:

我正在编写一个程序,接收与时间相关的数据,如果每分钟有多个数据点,我希望能够平均数据的值。数据点也有不同的设备,它们记录数据并且不能混合。我正在使用 pandas 数据框,并且输入的数据点几乎不会连续出现在同一列中,因此如果我希望它快速运行,我无法在它们进入时添加它们并稍后用存储的计数器对它们进行平均。关于如何在我去的时候记录平均值的任何想法?

    def add_data(self, x, whitelist, time_zone):
        y, mo, d, h, mi, s = self.parseDateTime(x['date'])   
        date = (dt.datetime(y, mo, d, h, mi) + dt.timedelta(hours=self.time_zones[self.time_zone])).strftime("%m/%d/%Y %I:%M %p")
        key = x['keys']
        val = x['val']
        if (val != 'NaN'):
            if(key in whitelist):
                self.dfOut[key][date] = val 

【问题讨论】:

  • 你能提供一个你的数据集的例子吗,最好是文本

标签: python python-3.x pandas dataframe average


【解决方案1】:

您可能想先清理数据,如果数据准备好进行分析,可能会创建一个新列,然后包含一些逻辑来比较数据应该在算法中计算平均值的位置,您能否分享一个示例数据和您可能拥有的任何算法。

【讨论】:

  • 由于数据属于我工作的公司,我目前无法共享数据样本,但我可以提供一个通用模板。该程序最终会格式化我们从产品中收到的所有数据。起始数据以包含三列数据的 csv 开始。时间,PRODUCT_NAME,价值记录。数据以时间标记所有行和产品名称标记列的格式结束。
猜你喜欢
  • 1970-01-01
  • 2020-04-23
  • 2015-09-11
  • 2017-01-28
  • 1970-01-01
  • 2022-01-08
  • 2022-01-23
  • 2023-02-17
相关资源
最近更新 更多