【发布时间】:2013-03-04 20:59:13
【问题描述】:
我是 RapidMiner 的新手...我想做的是我有一个包含 10 个文档的列表,我使用 ProcessDocuments 运算符(子任务)对其进行标记-> 标记...结果是 10由 800 个 示例集组成,包含 10 行(每个文档一个)和 800 个属性(每个标记一个)。
现在我想按长度过滤 800 个标记,我再次使用 ProcessDocuments 运算符(子任务)-> FilterByLength 在上一个 ProcessDocuments 运算符生成的世界列表上...结果是 800 x 700 matrix...800 表示来自先前 ProcessDocuments Operator 的 800 个标记和 700 个减少的标记集。
我想要完成的是一个 10 x 700 示例集,我可以将其传递给 Kmeans 聚类算子。我该怎么做?
谢谢
【问题讨论】:
标签: rapidminer