【发布时间】:2013-02-18 22:45:06
【问题描述】:
我对 R 很陌生,所以如果这个问题相对新手,我深表歉意。我有一个大约 33,000 行的列表,其中显示了订单 ID 和在该订单 ID 内订购的产品。结构如下:
Order.ID Product
193505 Pineapple Cheddar Burger
193505 Onion Rings
193564 Pineapple Cheddar Burger
193623 Hamburger
193623 French Fries
193623 Fountain Soda
193623 Hot Dog
193631 Hamburger
193631 French Fries
193631 Milkshake
193644 Daily Special
193726 Hamburger
193726 French Fries
193726 Fountain Soda
193728 Hamburger
193728 French Fries
193728 Fountain Soda
193738 Hamburger
193738 French Fries
193762 Hamburger
193762 French Fries
193762 Fountain Soda
193762 Hamburger
193762 French Fries
193762 Fountain Soda
我想生成一个相关矩阵,该矩阵反映以与其他商品相同的订单 ID 订购的每个商品的相关性。我首先使用table(ID, Product),它为我提供了在每个订单中订购的产品。现在我被困在如何计算每个其他产品(产品 2-k)的订单数量,因为已经订购了产品 1。理想情况下,我想对每种产品进行分析并将其转换为矩阵,但正确评估一个似乎是合乎逻辑的第一步。
如果我能就这个问题获得任何指导,我将不胜感激。提前致谢。
【问题讨论】:
-
您能否将
dput(your_example_data)的结果编辑到您的问题中?像现在这样将您的示例表读入 R 并不是特别容易。
标签: r matrix correlation