【问题标题】:Initialization of Xgboost DMatrix reduce features numberXgboost DMatrix 的初始化减少特征数
【发布时间】:2016-11-01 06:43:03
【问题描述】:

我正在尝试理解以下案例:

  1. 当我创建新的xgbost DMatrix

    xgX = xgb.DMatrix(X, label=Y, missing=np.nan)

  2. 基于输入数据 X 具有 64 个特征

  3. 我得到了具有 55 个功能的新 DMatrix

这里的魔法在做什么?任何建议都会很棒!

【问题讨论】:

标签: python python-2.7 pandas machine-learning xgboost


【解决方案1】:

看看 xgboost issue #1223

在那里,khotilov 发表评论:

CSR 的问题在于,当您在末尾有完全稀疏的列时,您无法仅通过查看 CSR 的索引和指针来确定它们的存在。

这样做的结果是,从 XXGDMatrixCreateFromCSR 创建 DMatrix 的函数不考虑最后的空列,在您的情况下是 9 列。您可能需要检查您的情况,并确定您是否真的在 X 中有 64 个功能。

【讨论】:

    猜你喜欢
    • 2016-05-25
    • 2019-04-29
    • 2016-12-09
    • 2022-06-13
    • 1970-01-01
    • 2021-12-23
    • 2018-03-20
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多