【发布时间】:2020-03-05 21:26:43
【问题描述】:
我有一个如下数据透视表,其中包含用户/商品的购买数量,如下所示:
originalName Red t-shirt Black t-shirt ... Orange sweater Pink sweater
customer ...
165 NaN NaN ... NaN NaN
265 NaN 1.0 ... NaN NaN
288 NaN NaN ... NaN NaN
368 1.0 NaN ... NaN 2.0
396 NaN NaN ... 3.0 NaN
如果我输入一个项目,我编写了通过使用皮尔逊相关性获取相关项目的方法
def get_related_items(name, M, num):
number_of_orders = []
for title in M.columns:
if title == name:
continue
cor = pearson(M[name], M[title])
if np.isnan(cor):
continue
else:
number_of_orders.append((title, cor))
number_of_orders.sort(key=lambda tup: tup[1], reverse=True)
return number_of_orders[:num]
我不确定为特定客户获取推荐商品列表的逻辑应该是什么。
我该如何评估呢?
谢谢!
【问题讨论】:
-
你想得到什么?最适合特定客户的商品?
-
@sygneto 是的,这就是我想要得到的
标签: pandas dataframe recommendation-engine