【发布时间】:2022-01-11 02:27:08
【问题描述】:
我正在从事一个项目,我的任务是查找不同维度(分类,即国家、职业等)和不同日期的异常数据(人数)。
以下是数据示例
count is count for people per day, country and occupation
我该怎么做?有什么推荐的 Python 库或模型吗?我找到了很多关于多元时间序列分析的教程,但我的数据不是多元时间序列,因为该数据集中的分类变量不依赖于时间。
【问题讨论】:
-
人数取决于时间。为什么说它不是时间序列?
-
这是一个时间序列。不是多元的,不是吗?我认为这是一个多时间序列问题,我不知道该怎么做。我有很多国家/职业。
-
最简单的方法是将每个国家/职业视为独立的组 - 并仅在这些组内建模。然后每一个都是一个简单的单变量时间序列。在组之间利用数据要困难得多
-
这是我目前所在的位置,但我希望找到一种更有效的方式,因为我有大约 7000 个职业和 25 个国家/地区。那是很多独立的团体。
-
查看贝叶斯动态建模:跨时空共享信息的方法youtube.com/watch?v=LVPikT58meg
标签: python time-series anomaly-detection