【发布时间】:2016-08-25 06:50:06
【问题描述】:
是否存在一些常用的强大的数据分析技术,这些技术是通用的,适用于各种情况下的各种数据?
例如,我需要对新数据进行分类。我已经有了它的分类。我需要尝试(我的想法示例如下):
- 尝试应用 PCA,然后应用 RandomForestDecisions;
- 通过方法 X(在 python 中使用 lib A)找到最重要的列,然后应用 Kohonen 网络 使用这种方式的所有数据;
- 尝试 SVM 与 马尔可夫链(请参阅 R 中的 this example 和 Mathematica 中的 this ,并在结果上使用K-nearest method改进结果;
- 使用此工具包来查找数据异常,并尝试通常的反向传播NN(如此处)或递归神经网络 喜欢这里;
- 在线性分类器(我的意思是this)上结合遗传算法(如this)。
例如,我了解到 xgboost *算法赢得了很多机器学习任务和比赛。
我觉得宇航员/宇航员在当前大量的数据挖掘工具和算法中潜入无限,并为可行的结果寻找正确但又强大的方法。感谢您对任何带有链接的 ML 原则的结构性愿景)
【问题讨论】:
标签: machine-learning neural-network data-mining data-analysis toolkit