【发布时间】:2019-05-21 21:46:29
【问题描述】:
我正在努力在 pyspark 上使用 ALS 来进行协同过滤。这些模型在如下数据框中给出预测结果。
CustomerID ProductID Rating
0 4 4.2
0 2 2.7
0 6 3
1 7 2.3
1 0 0.5
2 3 3.1
我想将数据框转换为用户到项目矩阵,如下所示,其中 productID 变为列,每一行代表一个用户对所有产品的评分。
0 0 2.7 0 4.2 0 3 0
0.5 0 0 0 0 0 0 2.3
0 0 0 3.1 0 0 0 0
因此对于这个数据框 R,R[0,2]=2.7 意味着用户 0 给产品 2 的评分为 2.7。R[2,3] = 3.1 意味着用户 2 给产品 3 的评分为 3.1。
在 pyspark 中有没有办法做到这一点?
【问题讨论】: