【发布时间】:2014-06-13 11:32:18
【问题描述】:
我有想要使用 Weka 聚类的高维(200 维)向量。我应该如何以 ARFF 格式表示它?
数据是这样的(dim1、dim2 等是实数):
vector_label dim1 dim2 dim3 ...... dim200
这里的链接 - http://weka.wikispaces.com/ARFF+%28stable+version%29 告诉我我应该如下表示它:
@RELATION vectors
@ATTRIBUTE vector_label STRING
@ATTRIBUTE dim1 NUMERIC
@ATTRIBUTE dim2 NUMERIC
@ATTRIBUTE dim3 NUMERIC
....
@ATTRIBUTE dim200 NUMERIC
@DATA
vector1,0.1,0.2,-2.1, ...... ,-0.1
等等。
这是正确的吗? 我问的原因是该链接并没有真正清楚地说明高维向量,但我觉得可能有更好的方式来表示它们,我不知道。
【问题讨论】:
标签: cluster-analysis weka arff