【发布时间】:2016-02-21 10:14:41
【问题描述】:
我想在 R 中对传感器数据的实时流进行异常检测。我想探索使用 Twitter anomalyDetection 或 anomalous。
我正在尝试考虑最有效的方法,因为一些在线资源表明 R 不适合实时异常检测。见https://anomaly.io/anomaly-detection-twitter-r。我应该使用stream 包来实现我自己的数据流源吗?如果我这样做,是否有任何“经验法则”关于我应该流多少数据才能拥有足够数量的数据(也许这是我需要试验的)?有什么方法可以在数据库中而不是在应用程序中进行异常检测以加快处理速度?
【问题讨论】:
-
可能,我也在寻找是否有专门的流处理算法用于异常检测(例如,我应该使用“流”包框架创建一个新的数据流任务实现吗?
-
我又来了(感觉有点寂寞)。关于将 Apache Storm 与 R 包 anomalyDetection 集成的任何博客/链接/建议?
标签: r time-series large-data