【发布时间】:2020-05-06 16:26:08
【问题描述】:
我有 1D 数据(在列数据上)。我使用高斯混合模型 (GMM) 作为密度估计,在 Python 中使用此实现:https://scikit-learn.org/stable/modules/generated/sklearn.mixture.GaussianMixture.html。通过依靠 AIC/BIC 标准,我能够确定组件的数量。在我拟合 GMM 之后,我绘制了原始观测值的核密度估计 + 从 GMM 中提取的采样数据的核密度估计。原始和采样密度的情节非常相似(很好)。但是,我想要一些指标来报告拟合模型的好坏。
g = GaussianMixture(n_components = 35)
data= df['x'].values.reshape(-1,1) # data taken from data frame (10,000 data pints)
clf= g.fit(data)# fit model
samples= clf.sample(10000)[0] # generate sample data points (same # as original data points)
我在实现中找到了分数,但不确定如何实现。我做错了吗?或者除了直方图或核密度图之外,还有什么更好的方法可以显示拟合模型的准确性?
print(clf.score(data))
print(clf.score(samples))
【问题讨论】:
标签: python-3.x scikit-learn gaussian data-fitting mixture-model