【问题标题】:How to create an ARFF file for high dimensional vectors in Weka?如何在 Weka 中为高维向量创建 ARFF 文件?
【发布时间】:2014-06-13 11:32:18
【问题描述】:

我有想要使用 Weka 聚类的高维(200 维)向量。我应该如何以 ARFF 格式表示它?

数据是这样的(dim1、dim2 等是实数):

vector_label dim1 dim2 dim3 ...... dim200

这里的链接 - http://weka.wikispaces.com/ARFF+%28stable+version%29 告诉我我应该如下表示它:

@RELATION vectors
@ATTRIBUTE vector_label STRING
@ATTRIBUTE dim1 NUMERIC
@ATTRIBUTE dim2 NUMERIC
@ATTRIBUTE dim3 NUMERIC
....
@ATTRIBUTE dim200 NUMERIC

@DATA
vector1,0.1,0.2,-2.1, ...... ,-0.1

等等。

这是正确的吗? 我问的原因是该链接并没有真正清楚地说明高维向量,但我觉得可能有更好的方式来表示它们,我不知道。

【问题讨论】:

    标签: cluster-analysis weka arff


    【解决方案1】:

    这种表述是正确的。当你有更多或更少的维度时,ARFF 表示没有特别的区别。

    但是,如果向量是稀疏的(大多数向量中的大多数维度值为零,您可能需要使用Sparse ARFF 表示,这样会更紧凑并节省磁盘空间和内存。

    【讨论】:

      【解决方案2】:

      如果您的数据不稀疏,则您的示例正确。如果您的数据稀疏,请使用sparse arff file format。 可以找到一个例子here

      【讨论】:

        猜你喜欢
        • 2015-06-24
        • 1970-01-01
        • 2013-12-31
        • 2015-04-30
        • 2014-08-12
        • 2012-06-23
        • 2016-03-01
        • 2012-12-13
        • 1970-01-01
        相关资源
        最近更新 更多