【发布时间】:2021-05-25 03:04:21
【问题描述】:
我在下面有这个数据框,我想检测每个主题的缺失访问,如何按主题对访问进行排序并仅提取具有缺失值的记录?请检查所需的两种类型的输出。
第 1 部分:因此,根据“访问”列中所有主题的最高数字,所有主题的缺失记录需要显示:
Subject Visit X1 X2
A 1 1647143 1672244
A 2 1672244 1689707
A 4 1689707 1713090
B 1 1735352 1760283
B 2 1760283 1788062
B 7 1788062 1789885
B 9 1789885 1790728
输出将是:
Subject Visit X1 X2
A 3 1647143 1672244
A 5 1672244 1689707
A 6 1689707 1713090
A 7 1647143 1672244
A 8 1672244 1689707
A 9 1689707 1713090
B 3 1735352 1760283
B 4 1760283 1788062
B 5 1788062 1789885
B 6 1789885 1790728
B 8 1789885 1790728
第 2 部分:因此,取决于访问序列中每个特定主题缺失记录的“访问”列中的最高数字,需要显示: 示例输出:
Subject Visit X1 X2
A 3 1647143 1672244
B 3 1735352 1760283
B 4 1760283 1788062
B 5 1788062 1789885
B 6 1789885 1790728
B 8 1789885 1790728
【问题讨论】:
-
您能否分享上述数据框的示例输出
-
@Devarshi Mandal 请看一下,我刚刚做了
-
在结果中填写 X1 和 X2 有什么要求?
-
不用看X1和X2 Jorge
-
创建缺失行时,行数据和 X1 和 X2 来自哪里?
标签: python r pandas dataframe tidyverse