【发布时间】:2016-01-07 20:55:50
【问题描述】:
我有一个学生资料数据集(年龄、性别、地址...等),并附有成绩说明(1 最差,5 最好)。 我想知道什么是最好的数据挖掘算法来确定那些表现大于 4 的学生的概况。 到目前为止,我一直认为在集群算法(K-means ...)总线中,这些是无监督算法,因此很难以 100% 的概率修复一个集群,让学生获得期望的表现。你有什么建议吗?是否有更好的算法来实现目标?谢谢!!
【问题讨论】:
-
您好,欢迎来到 StackOverflow。您能否发布一个您已经拥有的代码示例,以便我们可以从您现在的位置开始?
-
既然你已经有了性能说明,为什么还需要任何算法?
-
因为根据笔记,我很想知道有良好笔记的学生的个人资料值的预测概率。有人已经给了我一个很好的选择。谢谢!!
标签: algorithm machine-learning statistics data-mining