【发布时间】:2018-01-04 05:25:28
【问题描述】:
过去几个小时我一直在浏览论坛,但似乎找不到答案。
如果我有一个类似于下面显示的小示例的数据集。其中 A、B、C、D 和 E 是输入值,X 和 Y 是输出值。
(被赋值为“null”的缺失数据无关紧要,可以是任何东西)
A B C D E X Y
7 6 3 3 2 11 4
5 6 0 0 7 15 7
3 3 9 null 7 12 7
7 null 7 null 7 12 13
null 7 4 6 12 13 4
null 5 7 6 null 14 7
2 6 0 0 2 13 3
7 null 7 null 2 13 7
有没有办法在 keras 中训练神经网络,使其跳过空值,但仍考虑该行数据?
例如在第三行中,它会跳过 D 的值,因为它为空,但仍然适合使用其他 4 列和 2 个输出列?
对于我正在尝试的任务,不能忽略具有空值的行。它们也不能用任何其他值替换(例如,无法预测替换值)。
【问题讨论】:
-
当您不确定“无法预测替换值”时,最好用列平均值替换它们。检查此链接是否有帮助 stackoverflow.com/questions/37747886/…
-
也做不到。它是一个服装数据集,如果我因主观性质而找到平均值,它的有效性就会被破坏。
标签: python neural-network dataset keras