【问题标题】:R arules: Signify Duplicate itemsetsR arules:表示重复项集
【发布时间】:2025-12-24 02:00:12
【问题描述】:

我正在根据主题对数据集进行定性编码。每个观察都允许两个主题,因此我有两列具有相同的变量列表。当我运行 arules 时,它会将“v1=alpha;v2=beta”视为与“v1=beta;v2=alpha”不同的项目。如下,

| V1 | V2 |

| -------- | ----- |

|阿尔法 |测试版 |

|测试版 |阿尔法 |

这是我的代码:

  pr_itemset<-apriori(
     pr_trans,parameter=list(
     target="frequent",support=.001,minlen=2,maxlen=4))
     

【问题讨论】:

  • 所以我的问题是它是否有办法将它们识别为相同

标签: r arules


【解决方案1】:

这两行是不同的。如果您实际上希望项目是 ALPHA 和 BETA 而没有 V1 和 V2,因为每一行代表一组项目,那么您应该从一个集合列表(表示为字符向量)开始。代码如下所示:

library("arules")
mysets <- list(
   c('ALPHA', 'BETA'),
   c('BETA', 'ALPHA')
   )
trans <- transactions(mysets)

inspect(trans)
    items        
[1] {ALPHA, BETA}
[2] {ALPHA, BETA}

identical(trans[1], trans[2])
[1] TRUE

【讨论】: