【发布时间】:2017-10-27 15:40:48
【问题描述】:
我打算做一个是/否分类器。问题是数据不是来自我,所以我必须使用我得到的东西。我有大约 150 个样本,每个样本包含 3 个特征,这些特征是连续的数值变量。我知道数据集很小。我想问你两个问题:
A) 最好的机器学习算法是什么?支持向量机?神经网络?我读过的所有内容似乎都需要一个大数据集。
B)我可以通过添加一些不包含所有特征的样本来使数据集更大一点,只有一两个。我读过你可以在这种情况下使用稀疏向量,这对每个机器学习算法都可行吗? (我在 SVM 中见过它们)
非常感谢您的帮助!!!
【问题讨论】:
-
您能否包含可视化数据分布的图,例如按类别成员着色的二维散点图。任何不回答的尝试都只是猜测
-
下周某个时候我才会收到数据,我目前正在准备算法对不起,一旦我有它们我会发布它们
标签: machine-learning neural-network svm sparse-file