【发布时间】:2023-03-21 08:34:01
【问题描述】:
我希望根据标签对许多提要进行聚类。 一个典型的例子是 twitter 提要。每个提要都有与之关联的用户定义标签。通过分析标签,是否有可能将提要分成不同的组,并告诉这么多提要基于这么多标签。 一个例子是 -
- Feed1 - 印度尼西亚地震#earthquake #asia #bad
- Feed2 - 我所在地区发生大地震#earthquake #bad
- Feed3 - 我的父母去了新加坡#asia #tour
- Feed4 - XYZ 公司裁员很多人#XYZ #layoff #bear
- Feed5 - XYZ 情况越来越糟,正计划裁员 #XYZ #layoff #bad
- Feed6 - XYZ 处于裁员狂潮中#layoff #XYZ #worst
聚类后
- #asia , # 地震 - Feed1 , Feed2
- #XYZ , #layoff - Feed4 , Feed 5 , Feed6
这里的聚类纯粹是基于标签。 有什么好的算法可以实现这个
【问题讨论】:
标签: algorithm tags cluster-analysis