【问题标题】:outlier detection based on gaussian mixture model基于高斯混合模型的异常值检测
【发布时间】:2013-06-11 09:24:42
【问题描述】:

我有一组数据。我想从该数据构建一个类分布。根据学习到的分布,我想获得每个数据实例的概率值。 基于这个概率值(阈值),我想构建一个分类器来分类特定数据实例是否来自该分布。

在这种情况下,假设我有一个 50x100000 的数据,其中 50 是每个数据实例的维度,实例的数量是 100000。我正在学习基于此分布的高斯混合模型。

当我尝试获取实例的概率值时,我得到的值非常低。那么在这种情况下,我该如何构建分类器?

【问题讨论】:

  • 如果您只有“一类”=混合物中的一种成分,为什么还要使用混合物模型?

标签: matlab statistics probability gaussian probability-theory


【解决方案1】:

我认为这没有道理。例如,假设您的数据是一维的,并且假设事实是它是从bimodal distribution 中采样的。但是假设您还没有确定它来自双峰分布并且您适合正态分布。你仍然有最好的拟合,但它可能最适合错误的分布,而事实是没有一个点来自那个分布或任何看起来像它的分布。

【讨论】:

  • 如果我应用两次高斯函数来检测和排除数据集中每个参数的正数和负数的异常值,实际上我使用了双峰高斯分布?
猜你喜欢
  • 2018-06-17
  • 1970-01-01
  • 1970-01-01
  • 2012-09-11
  • 1970-01-01
  • 2019-01-04
  • 2021-09-30
  • 1970-01-01
  • 2013-04-17
相关资源
最近更新 更多