【问题标题】:Classification of unknown dataset into known categories将未知数据集分类为已知类别
【发布时间】:2019-11-12 07:36:10
【问题描述】:

我有许多数据集,其中有一个段端点的 x、y、z 坐标数组。第一个和第二个点代表一个段,第三个,第四个等等也是如此......

上面的数据只是数据集的一部分……整个数据集要大很多。

我需要用这样的几个数据集训练我的机器,以便它可以进一步预测任何未知数据集的类别......测试数据集也将与上述相同。

我需要有关方法的帮助。我可以在这里使用哪种算法或方法将任何未知数据集分类到这些已知类别?

【问题讨论】:

  • 你没有每一行的类吗?
  • 不,这些行只是问题中解释的段端点的 x、y、z 坐标
  • 那你知道你要几节课吗?
  • 您能否详细说明我应该如何上课以及这将有何帮助?如果你告诉我会非常有帮助...提前谢谢

标签: python-3.x machine-learning scikit-learn


【解决方案1】:

这是一个无监督学习问题。如果您大致知道应将数据拆分为多少类,请使用 K-Means (https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html)

否则,TSNE (https://scikit-learn.org/stable/modules/generated/sklearn.manifold.TSNE.html) 和 Kmeans 的组合通常效果很好。基本上使用 TSNE 转换数据并在转换后的数据中运行 Kmeans。

【讨论】:

    猜你喜欢
    • 2018-05-03
    • 2018-03-19
    • 1970-01-01
    • 2020-02-27
    • 1970-01-01
    • 1970-01-01
    • 2016-05-28
    • 2015-05-13
    • 2012-04-08
    相关资源
    最近更新 更多