【发布时间】:2016-01-10 06:53:47
【问题描述】:
我有一张包含时间戳和河流流量的表格。有时我有多个记录,有时我没有记录。
如何计算两个日期之间的平均流量和总流量?
假设两点之间的线性值是可以接受的。也许某种加权平均。如果有一些最小二乘回归算法或类似的东西可以提供更准确的结果,那也很好。
编辑。对于给定的一天,我有以下虚构数据用于说明目的。如果可能的话,我希望做得比假设平均值 146 更好,因为流量在较长时间内很高,而实际平均值可能超过 200。
10/12/15 12:00 AM 100
10/12/15 12:01 AM 102
10/12/15 12:02 AM 104
10/12/15 12:03 AM 106
10/12/15 12:04 AM 200
10/12/15 10:00 PM 204
10/12/15 11:00 PM 208
Average 146
【问题讨论】:
-
我不太确定我是否理解您的问题。您只是想要加权平均/回归,还是对已有的东西有技术问题?
-
最小二乘回归算法确定两个变量之间的最佳线性关系,但是您明确不希望“假设两点之间的线性值”。那么你想要什么样的关系呢?还是这个问题?在将离散数据转换为连续关系时,您必须做出一些假设。
-
@JulienBlanchard 如果可能的话,加权平均或回归会很好。
-
@eirikir 不,我说线性值“是”可以接受的。如果在 SQL 中可以使用 LSR,我认为那会更好。只是寻找任何可用的东西(希望快速简单)。
-
流量使用什么样的值?某种“每秒 x”,您想要时间范围内的总“x”?
标签: mysql sql time-series