【问题标题】:How to choose the data to replace the missing values i the dataset如何选择数据来替换数据集中的缺失值
【发布时间】:2019-04-26 14:21:23
【问题描述】:

我想知道我们在数据集中进行数据插补的方法。我在数据集中有缺失值。我们选择什么方法以及在什么基础上替换数据集中的 na 值

【问题讨论】:

  • 你能详细描述一下这个问题吗?你的数据集看起来如何?缺失值的性质是什么(离散/连续......)?你想用数据集做什么?你在训练机器学习模型吗?什么型号?
  • 您好,感谢您的回复。实际上我正在尝试在数据集上构建 ml 算法。我通常没想到数据插补的确切解决方案。我要求我们应该采用通用方法来进行数据估算我们需要考虑的事情

标签: data-science data-manipulation


【解决方案1】:

如果不知道您实际处理的数据,我无法确切告诉您该怎么做...但我认为 R 中的 wildcard 包非常有用。

如果您使用 R 来操作数据,请查看 this official document

【讨论】:

  • 您好,感谢您的回复。实际上我正在尝试在数据集上构建 ml 算法。我通常没想到数据插补的确切解决方案。我要求我们应该采用通用方法来进行数据插补我们需要考虑的事情
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-09-17
  • 2018-02-17
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多