【问题标题】:Group the near same numbers of a vector将向量的几乎相同的数字分组
【发布时间】:2021-02-04 15:40:02
【问题描述】:

我有以下向量:

c("a", "a", "b", "a", "a", "c", "c", "c")

我想根据接近相同的值将其元素分成几组。 结果是这样的:

[[1]] ("a", "a"), [[2]]("b"), [[3]]("a", "a"), [[4]]("c", "c", "c")

虽然第 1 组和第 3 组的元素相同,但它们不是邻居。所以他们属于不同的群体。 我尝试使用 for 循环来做,但还不够好。

【问题讨论】:

  • 使用 rle() 函数
  • 好的,我试试看。

标签: r run-length-encoding


【解决方案1】:

另一个选项,但 rleid 来自 data.table

> split(v,rleid(v))
$`1`
[1] "a" "a"

$`2`
[1] "b"

$`3`
[1] "a" "a"

$`4`
[1] "c" "c" "c"

或其他基本 R 选项

> split(v,cumsum(c(TRUE,head(v,-1)!=v[-1])))
$`1`
[1] "a" "a"

$`2`
[1] "b"

$`3`
[1] "a" "a"

$`4`
[1] "c" "c" "c"

【讨论】:

  • 抱歉,我好像只能接受一个答案
  • @Paul 不用担心,我只是想向您展示解决此问题的其他选项
  • 是的,这是data.table::rleid() 的一个很好的特性,它直接提供了一个必须通过rep 生成的输出
【解决方案2】:

使用此代码

vec <- c("a", "a", "b", "a", "a", "c", "c", "c")

v2 <- rle(vec)

split(vec,rep(1:length(v2$lengths), v2$lengths)) 

$`1`
[1] "a" "a"

$`2`
[1] "b"

$`3`
[1] "a" "a"

$`4`
[1] "c" "c" "c"

【讨论】:

  • 非常感谢。我学了两个新函数,一个是rle,一个是rep的新用法。
  • 很高兴能帮上忙。请接受并投票支持其他用户的帮助
  • 好的。因为我是stackoverflow的新手,所以我已经接受了答案,但似乎我无法投票,尽管我很乐意这样做。
猜你喜欢
  • 2020-06-22
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-10-15
  • 2017-02-25
  • 1970-01-01
  • 2020-05-14
相关资源
最近更新 更多