将向量的几乎相同的数字分组答案

【问题标题】：Group the near same numbers of a vector将向量的几乎相同的数字分组
【发布时间】：2021-02-04 15:40:02
【问题描述】：

我有以下向量：

c("a", "a", "b", "a", "a", "c", "c", "c")

我想根据接近相同的值将其元素分成几组。结果是这样的：

[[1]] ("a", "a"), [[2]]("b"), [[3]]("a", "a"), [[4]]("c", "c", "c")

虽然第 1 组和第 3 组的元素相同，但它们不是邻居。所以他们属于不同的群体。我尝试使用 for 循环来做，但还不够好。

【问题讨论】：

使用 rle() 函数
好的，我试试看。

标签： r run-length-encoding

【解决方案1】：

另一个选项，但 rleid 来自 data.table 包

> split(v,rleid(v))
$`1`
[1] "a" "a"

$`2`
[1] "b"

$`3`
[1] "a" "a"

$`4`
[1] "c" "c" "c"

或其他基本 R 选项

> split(v,cumsum(c(TRUE,head(v,-1)!=v[-1])))
$`1`
[1] "a" "a"

$`2`
[1] "b"

$`3`
[1] "a" "a"

$`4`
[1] "c" "c" "c"

【讨论】：

抱歉，我好像只能接受一个答案
@Paul 不用担心，我只是想向您展示解决此问题的其他选项
是的，这是data.table::rleid() 的一个很好的特性，它直接提供了一个必须通过rep 生成的输出

【解决方案2】：

使用此代码

vec <- c("a", "a", "b", "a", "a", "c", "c", "c")

v2 <- rle(vec)

split(vec,rep(1:length(v2$lengths), v2$lengths)) 

$`1`
[1] "a" "a"

$`2`
[1] "b"

$`3`
[1] "a" "a"

$`4`
[1] "c" "c" "c"

【讨论】：

非常感谢。我学了两个新函数，一个是rle，一个是rep的新用法。
很高兴能帮上忙。请接受并投票支持其他用户的帮助
好的。因为我是stackoverflow的新手，所以我已经接受了答案，但似乎我无法投票，尽管我很乐意这样做。