【问题标题】:Is it possible for features to be lists for clustering algorithms?特征是否有可能成为聚类算法的列表?
【发布时间】:2011-08-01 09:24:26
【问题描述】:

这是我的用例:

我有网络资源,每个资源都有一组视图。它来自网络导航,因此资源是您访问的内容,视图是实际访问。

对于每个视图,我都有关于位置、视图生成时间的信息,并且我可以获得诸如视图总数和在此资源上经过的时间等信息。

我想在此信息中找到不同的模式,以确定用户配置文件。如果对于每个资源我只有一个视图,则可以很容易地对它们进行集群,但由于我确实有许多视图,有没有办法可以使用这些信息来更好地集群资源?

【问题讨论】:

    标签: machine-learning


    【解决方案1】:

    如果我理解正确,您希望根据资源的视图对资源进行聚类。为此,您可能希望根据视图的统计信息制作特征向量。例如,您的特征向量可以包括:观看总数、观看者位置的标准偏差、一天中的平均观看时间、资源年龄等。然后您可以将这些特征向量输入到聚类算法中。您要使用的确切功能将取决于您对集群的使用。如果您想让集群反映资源的内容并且资源是基于文本的,那么我建议您也使用bag of words

    【讨论】:

    • 谢谢,这正是我想要的。我正在计算 stdev、avg 和其他指标,它的工作就像一个魅力。
    【解决方案2】:

    很难说你到底在问什么。是的,feature vectors 广泛用于机器学习算法。

    【讨论】:

      猜你喜欢
      • 2011-12-10
      • 2020-02-28
      • 2016-10-14
      • 2017-07-07
      • 1970-01-01
      • 2019-08-05
      • 2011-09-04
      • 2017-11-16
      • 2020-03-17
      相关资源
      最近更新 更多