【发布时间】:2011-10-26 23:02:53
【问题描述】:
我读过有关使用奇异值分解 (SVD) 在文本语料库中进行潜在语义分析 (LSA) 的文章。我已经了解如何做到这一点,我也了解 SVD 的数学概念。
但我不明白为什么它适用于文本语料库(我相信 - 必须有语言解释)。有人能从语言学的角度解释一下吗?
谢谢
【问题讨论】:
-
这可能更适合 cstheory.stackexchange.com。
-
嗨,我也有同样的疑问!是否必须减少尺寸?为什么我们不能只使用 v 矩阵来查找文档之间的相似度,而使用 u 矩阵来查找术语之间的相似度?
标签: algorithm nlp data-mining text-mining latent-semantic-indexing