【发布时间】:2020-04-26 16:10:49
【问题描述】:
我正在根据Kaggle 的心脏病数据训练一个决策树模型。
由于我也在使用 10 倍 CV 构建其他模型,因此我正在尝试使用 caret 包和 rpart 方法来构建树。然而,情节结果很奇怪,因为“铊”应该是一个因素。为什么它显示“thaliumnormal
非常感谢!
编辑:我很抱歉没有提供足够的背景信息,这似乎造成了一些混乱。 “铊”是一个变量,代表一种用于检测冠状动脉狭窄(又名狭窄)的技术。它是一个具有三个级别(正常、固定缺陷、可逆缺陷)的因子。
此外,我想让图表更具可读性,例如而不是“thaliumnormal
但是,您可能已经注意到树是不同的,尽管我使用了推荐的 cp 值和 caret rpart CV 10 folds(参见下面的代码)。
我了解这两个包可能会导致一些差异。理想情况下,我可以使用 caret 和方法 rpart 来构建树,以便它与 caret 中内置的其他模型对齐。有谁知道如何使使用插入符号 rpart 构建的树模型的绘图标签更易于理解?
【问题讨论】:
标签: r decision-tree r-caret rpart