【发布时间】:2018-10-25 07:33:02
【问题描述】:
我目前在 BigQuery 中有一个包含一些异常值的表
示例表:
port - qty - datetime
--------------------------------
TCP1 - 13 - 2018/06/11 11:20:23
UDP2 - 15 - 2018/06/11 11:24:24
TCP3 - 14 - 2018/06/11 11:24:27
TCP1 - 2 - 2018/06/11 11:24:26
UDP2 - 15 - 2018/06/11 11:35:32
TCP3 - 13 - 2018/06/11 11:45:23
TCP3 - 14 - 2018/06/11 11:54:22
TCP3 - 30 - 2018/06/11 11:55:33
我希望能够使用 SQL 和标准差在 2018/06/11 筛选出各个端口上的异常值
结果:
TCP1 - 2 - 2018/06/11 11:24:26
TCP3 - 30 - 2018/06/11 11:55:33
我做了一些研究,发现标准差能够帮助筛选出异常值。但是,我不知道如何编写 SQL 查询来完成这项工作。任何帮助将不胜感激。
(这是我能找到的关于这个主题的最接近的线程:Using BigQuery to find outliers with standard deviation results combined with WHERE clause)
【问题讨论】:
标签: statistics google-bigquery standard-deviation