【问题标题】:Finding unique values in a dataset for market basket analysis in csv file在数据集中查找唯一值以在 csv 文件中进行购物篮分析
【发布时间】:2025-12-31 18:05:03
【问题描述】:

我正在做购物篮分析,数据表包含杂货,我想知道有多少独特的商品?请帮帮我

【问题讨论】:

  • 请向我们展示您的数据以更好地帮助您
  • 欢迎来到 SO。请将鼠标悬停在 R 标签上 - 它要求提供一个最小的可重现示例。 Here's a guide;还可以查看 R 帮助文件(例如 help(p="arules"))。之后,相应地编辑和改进您的问题。一个好的通常会提供最少的输入数据、所需的输出数据、代码尝试包括所需的包——所有这些都可以在新的/干净的 R 会话中复制-粘贴-运行。 为什么?它让所有人更容易关注和参与。

标签: r


【解决方案1】:

考虑例如:

# create demo comma-separated file:
library(arules)
data(Groceries)
lst <- as(Groceries, "list")
writeLines(sapply(lst, paste, collapse=","), tf<-tempfile(fileext = ".csv"))
# readLines(tf)[1:3]
# # [1] "citrus fruit,semi-finished bread,margarine,ready soups"
# # [2] "tropical fruit,yogurt,coffee"                          
# # [3] "whole milk" 

# load csv and check number of items
trans <- read.transactions(tf,"basket",sep=",")
trans
# transactions in sparse format with
#  9835 transactions (rows) and
#  169 items (columns)
ncol(trans)
# [1] 169

【讨论】: