【发布时间】:2018-06-17 19:38:48
【问题描述】:
在一个 numpy 数组中,我的 17 个特征中的每一个都有 5000 个数据点,从而产生一个 5000 x 17 的数组。我正在尝试使用高斯混合找到每个特征的异常值,但我对以下问题感到困惑:1)我的 GaussiasnMixture 应该使用多少个组件? 2) 我应该将 GaussianMixture 直接拟合到 5000 x 17 的数组上还是分别拟合到每个特征列上,从而产生 17 个 GaussianMixture 模型?
clf = mixture.GaussianMixture(n_components=1, covariance_type='full')
clf.fit(full_feature_array)
或
clf = mixture.GaussianMixture(n_components=17, covariance_type='full')
clf.fit(full_feature_array)
或
for feature in range(0, full_feature_matrix):
clf[feature] = mixture.GaussianMixture(n_components=1, covariance_type='full')
clf.fit(full_feature_array[:,feature)
【问题讨论】:
标签: python detection gaussian mixture