【发布时间】:2012-01-28 01:08:43
【问题描述】:
我有一个包含多个项目对象的站点。每个项目都有(例如):
- 多个标签
- 多个类别
- 大小
- 多种类型
- 等
我想根据上述标准编写一个方法来抓取所有“相似”项目。我可以轻松地为上述每个项目单独检索类似的项目(即类似规模的项目或共享一个类别的项目等),但我希望它更智能,然后只选择具有上述所有共同点的项目,或至少具有上述一项共同点的项目。
理想情况下,我想对每个标准进行加权,即具有共同标签的项目不太“相似”,然后是大小相近的项目等。具有两个共同标签的项目更相似而不是一个有一个共同标签的项目等等。
我可以采取什么方法(实际和数学上)来做到这一点?
【问题讨论】:
标签: math machine-learning data-mining taxonomy