【发布时间】:2020-04-18 03:35:07
【问题描述】:
我使用 sklearn 为二进制分类问题构建了各种 ML 模型。数据集是我的教授提供给我的,用于这项比较研究。
my jupyter notebook and dataset can be found here
由于我的准确率非常低,我担心我在构建模型时一定做错了什么。因此,我在 sklearn(乳腺癌数据集)中的内置数据集上测试了我的决策树,这与我的数据集非常相似,因为它们都是二元分类。在这里,我得到了 95% 的平均准确率。所以我现在认为问题可能出在我的数据集上。我能否就如何预处理我的数据或我可能会考虑提高准确性的任何其他步骤获得一些帮助。
【问题讨论】:
-
不要在问题中附加图片,添加您的代码/结果并使用代码语法突出显示按钮来突出显示它们。
标签: python-3.x dataframe scikit-learn decision-tree