R + 将一个向量列表组合成一个向量答案

【问题标题】：R + combine a list of vectors into a single vectorR + 将一个向量列表组合成一个向量
【发布时间】：2013-03-09 01:34:57
【问题描述】：

我有一个数字向量列表，我想将它们组合成一个向量。但我无法做到这一点。该列表可以有一个跨列表元素共有的元素。最终向量不应将它们添加两次。这是一个例子：

>lst
`1`
[1] 1 2
`2`
[2] 2 4 5
`3`
[3] 5 9 1

我想要这样的最终结果

>result
[1] 1 2 4 5 9 1

我尝试做以下事情，而不用担心重复：

>vec<-vector()
>sapply(lst, append,vec)

和

>vec<-vector()
>sapply(lst, c, vec)

他们都没有工作。有人可以帮我解决这个问题吗？

谢谢。

【问题讨论】：

谢谢@JoshO'Brien。但这不会删除重复的值。
@joran 我怀疑unique 是否足够细粒度； unique 可以很容易地删除 adjacent 列表组件之间的超过 1 个公共元素。注意unique(unlist(lst)) 不会给出 OP 想要的。
您是说您不希望任何重复的值彼此相邻吗？或者你是说如果一个向量的结尾与下一个向量的开头匹配，你只是不想重复一个元素？提供更多示例可能会有所帮助...
@JoshO'Brien unique() 将删除 OP 声称应该在输出中的 1s 之一。
这行得通，但我不确定如果它在列表元素中有重复值是否行不通：unique(do.call(c, lst))。根据@MatthewLundberg 的福音，rle(do.call(c, lst))$values。根据我的基准，Matthew 的解决方案更快。

标签： r list vector append sapply

【解决方案1】：

比上面提出的更快的解决方案：

vec<-unlist(lst)
vec[which(c(1,diff(vec)) != 0)]

【讨论】：

vec[which(c(1,diff(vec)) != 0)] 是什么？
但它比上面建议的更快吗？
@Galaxy 这是为了删除连续重复，同时保留被其他元素分隔的重复元素。 diff() 将前一个值减去当前值。如果diff(vec) 等于零，则表示当前值和前一个值相同，可以删除此值。例如使用lst <- list(c(1,2),c(2,4,5),c(5,9,1)) 和vec<-unlist(lst)。 vec[which(c(1,diff(vec)) != 0)] 将删除所有连续的重复，但它会将重复的保留在末尾。

【解决方案2】：

使用Reduce() 的另一个答案。

创建向量列表：

lst <- list(c(1,2),c(2,4,5),c(5,9,1))

将它们组合成一个向量

vec <- Reduce(c,lst)
vec
# [1] 1 2 2 4 5 5 9 1

重复的只保留一次：

unique(Reduce(c,lst))
#[1] 1 2 4 5 9

如果你想在最后保留那个重复的，你可能想在@Rachid的回答中使用vec[which(c(1,diff(vec)) != 0)]

【讨论】：

事实上unlist(lst) 比Reduce(c,lst) 更容易。

【解决方案3】：

你想要rle：

rle(unlist(lst))$values

> lst <- list(`1`=1:2, `2`=c(2,4,5), `3`=c(5,9,1))
> rle(unlist(lst))$values
## 11 21 22 31 32 33 
##  1  2  4  5  9  1

【讨论】：

我也是这么想的。我遇到的一个问题是我不知道他们是否想删除列表元素中的重复值...
这实现了我想要做的事情。我也可以使用以下选项：vec<-unlist(lst); vec[which(c(1,diff(vec)) != 0)] 现在我想知道哪个更好？
这可能会更快，因为它做的工作更少（在你的小例子上更快，在我的机器上）。查看rle 的代码。您可以将其添加为另一个答案。
@MatthewLundberg 你是如何计算时间的？？

【解决方案4】：

stack 也能很好地做到这一点，而且看起来更简洁：

stack(lst)$values

【讨论】：

【解决方案5】：

通过Rachit 和Martijn 对两个答案进行基准测试

rbenchmark::benchmark(
  "unlist" = {
    vec<-unlist(a)
    vec[which(diff(vec) != 0)]
  },
  "reduce" = {
    a %>% reduce(c) %>% unique
  }
)

输出：

    test replications elapsed relative user.self sys.self user.child sys.child
2 reduce          100   0.036        3     0.036    0.000          0         0
1 unlist          100   0.012        1     0.000    0.004          0         0

This 一个明显胜过另一个。

【讨论】：

【解决方案6】：

以整洁的方式进行：

library(tidyverse)
lst %>% reduce(c) %>% unique

这将 purrr 中的（未大写的）reduce 版本与管道结合使用。另请注意，如果列表包含 named 向量，则最终命名将根据使用的是unlist 还是reduce 方法而有所不同。

【讨论】：