R - 根据条件连接行？答案

【问题标题】：R - concatenate rows based on conditions?R - 根据条件连接行？
【发布时间】：2025-12-07 19:45:02
【问题描述】：

我在 R 中创建了一个映射表，并提供了一个示例：

ex <- data.frame("id" = c(rep(1234,7)), "claim" = c(1234, 1367, 1234, 1869, 1234, 1367,1234),
             "code1" = c(24, 61, 28, 21, 20, 29,80), date = c('2019-03-18', '2019-04-12',
                                                           '2019-03-18', '2019-03-18',
                                                           '2019-03-18', '2019-04-12', '2019-03-18'),
             'code2' = c(24,29,24,24,24, 29,24), dx1=c("M234","M123",NA,"M434",NA,NA, NA),
             dx2=c(NA,NA,NA,NA,"M789","Z123", "M999"),
             dx3 = c(NA,NA,"M689",NA,NA,NA, NA),
             pay = c(1000, 520, 1000, 780, 1000,520,1000))

我有什么办法可以把它作为我的最终输出：

ex2 <- data.frame("id" = c(rep(1234,3)), date = c('2019-03-18', '2019-03-18','2019-04-12'),
              'code2' = c(24,24,29),
              dx1=c("M234","M434","M123"),
              dx2=c("M789",NA,"Z123"),
              dx3 = c("M689",NA,NA),
              dx4 = c("M999", NA, NA),
              pay = c(1000,780,520))

我基本上希望将示例 1 中 dx2 或 dx3 中的任何值添加到与该 code2 值对应的同一行中。但是，如果 dx1 中的 code2 有多个值，那么我想将它们保留为单独的行。

有什么方法可以在 R 中做这样的事情吗？提前致谢！

编辑：在我的映射表（例如）中，只有 dx1、dx2、dx3 列。我希望将 dx2 或 dx3 中的任何多个值作为新列添加（这就是为什么在 ex2 中现在有一个 dx4 列）。这些更改按 code2 分组。因此，如果代码 24 在 dx2 或 dx3 中有多个值，那么这将决定创建多少新的 dx2 列。然后可以通过 max(pay) 列确定订单。

【问题讨论】：

ex 中没有dx4，但ex2 中有。看起来dx4 值是dx2 的倍数。你能详细描述一下如何处理每个dx 类型的多个值吗？
我在 Q 中加入了解释。如果有帮助，请告诉我！
谢谢，这是有用的信息。这是一个不寻常的操作模式。例如，如果dx1、dx2 和dx3 在code2 中的一个级别各有2 个值，那么您是说您想要两行（每个dx1 一个）bu 然后是四列除了dx1，现在是dx2-5？您如何决定将dx2 和dx3 值中的哪一个放在新列中？也许如果你能多解释一下你的用例，帮助你找到一个更简单的解决方案会更容易。
另外，dx2 和dx3 的值是否应该只出现在分组code2 的第一行？还是对代表唯一 dx1 的所有行重复？
应该如何处理ex 的第6 行，其中没有dx1 值，但有dx2 值？在ex2 中，您将此dx2 值与dx1 放在同一行。但请考虑code2 == 29 中是否有两个dx1 值。您将如何在没有dx1 的行上分配dx2？

标签： r dataframe data.table concatenation tidyverse

【解决方案1】：

你需要这个吗？

library(tidyverse)

ex %>% pivot_longer(cols = c("dx1", "dx2", "dx3"), names_to = "code3", values_to = "val", values_drop_na = T) %>%
  arrange(claim, code2, code3) %>% group_by(id, claim, date, code2, code3) %>%
  mutate(dummy = n(),
         dummy2 = row_number(),
         code3 = ifelse(dummy >1 & dummy2 >1, "dx4", code3)) %>% arrange(code3) %>%
  pivot_wider(id_cols = c('id', 'claim', 'date', 'code2', 'pay'), names_from = 'code3', values_from = 'val', values_fn = min) %>%
  ungroup() %>% select(-claim)

# A tibble: 3 x 8
     id date       code2   pay dx1   dx2   dx3   dx4  
  <dbl> <chr>      <dbl> <dbl> <chr> <chr> <chr> <chr>
1  1234 2019-03-18    24  1000 M234  M789  M689  M999 
2  1234 2019-04-12    29   520 M123  Z123  NA    NA   
3  1234 2019-03-18    24   780 M434  NA    NA    NA

【讨论】：

请说明 dx1-dx3 中是否可以有两个以上的值？
满足要求了吗？