【发布时间】:2016-04-27 20:35:46
【问题描述】:
我认为这可能之前已经讨论过,但不知怎的我找不到答案,所以在这里。
以下是一些客户调查中使用 gensim lsi 生成的主题。我的问题是:
- 单词前面的减号和加号是什么意思?
- 在这里我生成了 5 个主题,我还可以生成更多。如何确定最佳主题数量?例如,也许在第三个主题之后,统计上的其他一切都将变得微不足道。
欢迎提出任何建议。
0.527*“利息”+ 0.475*“较低”+ 0.376*“利率”+ 0.338*“利率”+ 0.324*“好”+ 0.257*“服务” 0.671*"好" + 0.586*"服务" + -0.254*"利息" + -0.251*"较低" + -0.159*"利率" + -0.150*"利率" 0.600*“很棒”+ 0.351*“轻松”+ 0.337*“奖励”+ 0.242*“使用”+ -0.167*“服务”+ 0.160*“喜欢” -0.503*"rates" + 0.499*"rate" + -0.39*"great" + 0.364*"high" + -0.289*"lower" + 0.167*"easy" -0.608*"伟大" + 0.362*"容易" + -0.303*"率" + 0.275*"率" + 0.244*"使用" + -0.227*"高"
【问题讨论】:
标签: gensim