【问题标题】:Partial data sets in R [closed]R中的部分数据集[关闭]
【发布时间】:2010-11-18 15:13:53
【问题描述】:

我们希望使用以下结构训练 R: 年龄, data1, data2, ... dataN, 动作

其中 N 取决于我们拥有的关于一个人的数据量。

我们的目标是通过查询我们拥有的他/她的所有数据来确定另一个人产生操作的可能性有多大。

age, data1, data2, ...dataM 其中 M 可以大于或小于 N。

有了完整的数据集,我们可以使用二元逻辑回归。但是我们需要使用部分集合。

通过询问部分数据集来计算一个人执行操作的可能性的最佳方法是什么?

【问题讨论】:

  • 大胆猜测:您正在尝试一些引导程序?您可能会在stats.stackexchange.com 上获得更好的运气,并对设置进行更多解释。您不必手动引导,R 中有相应的框架。
  • 更新了一个问题。

标签: r statistics


【解决方案1】:

Hmisc 包提供了多个多重插补函数,提供了一种更完整地使用数据中存在的信息的方法。

require(Hmisc)
?aregImpute  # with several worked examples

随附的包 rms 具有二元逻辑回归函数:

require(rms)
?lrm

【讨论】:

  • 我认为引导包更符合他的要求。插补尤其适用于缺失数据,引导是另一回事。
猜你喜欢
  • 2013-12-16
  • 2021-05-02
  • 2014-11-16
  • 1970-01-01
  • 1970-01-01
  • 2015-11-02
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多