【发布时间】:2018-01-19 14:35:54
【问题描述】:
我在 RStudio 的数据框中工作,试图了解锻炼与人的总体健康状况之间是否存在相关性。有三个主要变量:
exerof1:此变量与研究人员在过去 30 天内锻炼的次数有关。
exerany2:在这个变量中,如果参与者在上个月练习了练习,他们会回答,因此他们可以说是,否或拒绝回答。
genhlth:一个因子变量,将观察分为 5 个级别。
我已经转换了 exeroft1 变量,但是这个变量的 30% 是 NA,其中大多数是 NA,因为他们在“exerany2”问题中回答“否”。
我的目标是识别在“exerany”变量中说“否”并在 exerof1 中列为“NAs”的人,以将这些“NAs”转换为 0。
我不知道我的分析是否是最好的方法,因为我是初学者。我尝试使用 ifelse 做我想做的事,但我很挣扎。我也尝试检查是否有另一个线程具有相同的问题,但我找不到。
我会等待您的反馈。
【问题讨论】:
-
欢迎来到 SO!请阅读How to Ask 和minimal reproducible example ... 然后编辑您的问题!到目前为止您尝试了什么?
-
由于您的问题更多的是关于哪种分析而不是如何对其进行编程,因此它可能更适合获得一些统计建议。我已投票将 ot 移至stats.stackexchange.com/questions
-
@user20650 我相信在
R中执行NA插补的部分内容进入stackoverflow.com。还有一些关于何时将NA与0归类的疑问,我想说这非常依赖于上下文,不确定这是否是一个统计问题。