用于计算机视觉的 Python 中的 LDA

【问题标题】：LDA in Python for Computer Vision用于计算机视觉的 Python 中的 LDA
【发布时间】：2017-07-27 07:47:43
【问题描述】：

我正在使用 LDA（潜在狄利克雷分配）主题建模进行基于内容的图像检索。我希望使用 Python 来做同样的事情。我无法在 Python 中为图像数据集的 LDA 找到任何库/包。This 包似乎仅适用于文本语料库。请推荐任何用于图像语料库的 Python 包，或简要列出执行图像 LDA 所需的步骤。

【问题讨论】：

标签： python computer-vision lda content-based-retrieval

【解决方案1】：

我最近使用 Python 中的 LDA 实现了基于视觉词的图像检索。请查看我的github 页面了解详情。

视觉词是在图像关键点处提取的图像特征的聚类中心。在这个例子中，密集的 SIFT 特征是从 40 个不同人的 10 张人脸图像的集合（Olivetti 人脸数据集）中提取的。

使用 mini-batch K-means 将 128 维 SIFT 特征聚类到包含 K 个视觉词的字典中。在线变分贝叶斯算法用于学习 LDA 主题模型并提取主题比例以用于训练图像数据。

然后将测试图像数据转换为主题空间，并根据训练图像和测试图像的主题比例之间的余弦相似度检索训练图像。

【讨论】：