【发布时间】:2013-11-10 23:36:40
【问题描述】:
当用户访问我的 Python Web 服务时,我正在收集很多非常有趣的数据点。例如,我有他们当前的城市、州、国家、用户代理等。我想做的是通过某种类型的机器学习系统/算法(也许是贝叶斯分类器?)运行这些,用发生异常情况时获得电子邮件通知的最终目标(异常检测)。例如,Jane Doe 只从美国登录 Chrome。因此,如果她突然在 Firefox 上从乌克兰登录我的网络服务,我希望将其视为非常“不寻常”的事件并触发通知。
我已经在使用 CouchDB(特别是与 Cloudant 一起使用),而且我看到人们经常在网上到处说 Cloudant / CouchDB 非常适合这类事情(大数据分析)。但是,我完全不知道从哪里开始。我没有找到太多关于相对简单的 Web 服务外部事件跟踪的文档,更不用说使用 CouchDB 存储以前“学习”的数据了。我看到了几个专门的系统来处理这种类型的数据(我想到了 PredictionIO),但我不禁觉得首先考虑到 CouchDB 的性质,它们有点矫枉过正。
任何见解将不胜感激。谢谢!
【问题讨论】:
-
AFAIK,问题与现在精心设计的欺诈检测领域密切相关。您可以从出色的 ML 欺诈检测方法调查开始arxiv.org/ftp/arxiv/papers/1009/1009.6119.pdf
标签: python machine-learning couchdb bayesian cloudant