【问题标题】:Dataframe to fill in with missing values - complete() function用缺失值填充的数据框 - complete() 函数
【发布时间】:2021-09-21 15:34:03
【问题描述】:

我有一个初始数据框df,其中包含 30 个样本,包含以下列:

  1. ID : chr "ACAGA" "GTCGA" "GTCGA" "ACAGT" ...
  2. 值:数字 1.40 2.28 0.39 1.32 ..
  3. 尺寸:int 119 716 626 114 ...

在这个 df 数据帧中,每个 ID 重复多次。

然后,我创建了第二个名为 df2 的数据框,仅选择值 > 1.3 的那些 ID,并将每个 ID 的所有维度相加。

df2 = df[value > 1.3, .(dim = sum(dimension)), by = ID] 

新数据框 df2 没有来自 df 的所有初始 ID。特别是,我想在 df2 数据帧中添加 4 个缺失的 ID,并将它们的 dim 值设置为 0。

我尝试使用 tidyr 包中的 complete() 函数,但我编写的代码不起作用:

complete(df2, dim, fill = list(count = 0))

你知道我应该如何使用 complete() 来达到我想要的结果吗?

【问题讨论】:

    标签: r dataframe tidyr missing-data


    【解决方案1】:

    如下尝试complete -

    df2 <- tidyr::complete(df2, ID = unique(df$ID), fill = list(dim = 0))
    

    【讨论】:

      猜你喜欢
      • 2018-12-17
      • 2023-04-01
      • 1970-01-01
      • 1970-01-01
      • 2017-12-06
      • 1970-01-01
      • 2020-10-28
      • 1970-01-01
      • 2020-06-06
      相关资源
      最近更新 更多