【发布时间】:2016-08-16 17:30:38
【问题描述】:
大家好,我是 scala 和 spark MLIB 的新手。
我有一个疾病数据集以及以下格式的症状:
疾病,症状1 症状2 症状3
我在 CSV 文件中有近 300 个上述格式的条目。
我想实现以下功能:
如果用户输入了症状,即症状 1、症状 2、症状 3,则模型必须能够预测疾病。
我有以下问题:
-
我应该使用哪种机器学习模型来实现此功能。
-
我已经研究了一些模型,如果有错误请纠正我。
-
我可以向朴素贝叶斯模型提供文本输入吗?
-
是否有任何示例代码可用于实现此功能。
【问题讨论】:
标签: scala apache-spark machine-learning naivebayes