【问题标题】:What should I do when I have date with the NULL features?当我与 NULL 功能约会时该怎么办?
【发布时间】:2013-08-10 18:20:14
【问题描述】:

我有大量数据,有些信息丢失(NULL)。我应该在学习过程中跳过这个例子还是做其他事情?

【问题讨论】:

  • NULL 数据可能有也可能没有结构;你必须确定要做什么。
  • NULL可以是数据,to.
  • @Anony-Mousse 可能,但在我的情况下,这可能只是意味着丢失信息。我不确定是否会为您提供更多信息。

标签: machine-learning svm scikit-learn


【解决方案1】:

真的取决于数据以及您的想法是有意义的。如果您认为NULL信息可能有意义,则一个选项是创建一个新变量,表示具有空数据的条目。例如,如果您拥有具有空值的真/假分类数据,如

1, 0, 1, NULL, NULL, 1, 1, NULL

您可以将其转换为:

1  0  1  0  0  1  1  0  <- true
0  1  0  0  0  0  0  0  <- false
0  0  0  1  1  0  0  1  <- NULL

可以使用浮点值完成类似的东西。

当然,如果你不认为它们是NULL的事实,你也可以用受过教育的猜测(可能是平均值)丢掉空值或用受过教育的猜测替换它们。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2017-12-08
    • 2014-04-24
    • 1970-01-01
    • 2015-04-15
    • 1970-01-01
    • 1970-01-01
    • 2010-11-25
    • 2019-12-27
    相关资源
    最近更新 更多