【发布时间】:2011-05-21 23:21:55
【问题描述】:
如何在 Perl 中计算两个文档的余弦相似度距离?几个问题: 1) CPAN 中是否已经有用于计算余弦相似度距离的模块?还是这个任务很容易编写代码? 2)当我说文档时,我的意思是一个“文档”是一个句子,另一个“文档”只是一个关键字列表。公平地说,在计算余弦相似度距离之前,我应该对每个文档中的所有关键字分别进行标记、小写和排序吗?
【问题讨论】:
-
这是家庭作业/作业吗?
标签: perl similarity trigonometry