【问题标题】:R-convert transaction format dataset to basket format for Market Basket Analysis将交易格式数据集 R 转换为篮子格式以进行市场篮子分析
【发布时间】:2015-01-12 20:18:03
【问题描述】:

首先我想澄清一下,在发布此查询之前,我已经参考了本网站中的以下链接以找到答案,但无法理解,可能是因为它们解决了不同的问题,或者因为我是 R 新手。

R-convert transaction format dataset to basket format for sequence mining

Arules Sequence Mining in R

How to handle "argument 'incomparables != FALSE' is not used (yet)"?

我想用我的数据集进行购物篮分析。我的数据集是交易格式(如下所述),我想将其转换为篮子格式(如下所述)。

我的输入文件是一个 csv 文件,数据集的交易格式如下:

TransactionID ProductID
A              1
A              2
B              1
C              3
A              4
B              3

我希望我的输出文件是一个篮子格式的 csv 文件,如下所示:

1 2 4
1 3
3

其中 {1,2,4} 是在交易 A 中购买的产品,{1,3} 是在 B 中购买的产品,依此类推。

您能告诉我执行此操作的 R 代码吗?我尝试使用以下代码,但它不起作用。我的输入文件名是“D01_modified1.csv”。

library(arulesSequences)
# Read CSV into R
MyData <- read.csv(file="D01_modified1.csv", header=TRUE, sep=",")
s <- unique(MyData,incomparables = FALSE, fromLast = FALSE,paste0("ProductID"))
# Write CSV in R
write.csv(s, file = "MyOutput.csv",row.names=FALSE, na="")

它给出了以下错误:

Error: argument 'incomparables != FALSE' is not used (yet)

我也不确定下面的代码是否会给我想要的输出。

s <- unique(MyData,incomparables = FALSE, fromLast = FALSE,paste0("ProductID"))

请指导。期待您的帮助。非常感谢...

【问题讨论】:

    标签: transactions market-basket-analysis


    【解决方案1】:

    对我有用

    df_fact <- data.frame(lapply(MyData,as.factor))
    df_trans <- as(df_fact, 'transactions')
    

    希望对你有帮助。

    【讨论】:

      猜你喜欢
      • 2014-02-25
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-12-19
      • 1970-01-01
      • 2020-10-18
      • 1970-01-01
      相关资源
      最近更新 更多