【发布时间】:2015-03-02 14:12:10
【问题描述】:
我想使用 Spark 的 mllib.recommendation 库来构建一个原型推荐系统。但是,我拥有的用户数据的格式是以下格式:
AB123XY45678
CD234WZ12345
EF345OOO1234
GH456XY98765
....
如果我想使用mllib.recommendation库,根据Rating类的API,用户id必须是整数(也必须是连续的?)
看起来必须在真实用户 ID 和 Spark 使用的数字用户 ID 之间进行某种转换。但是我该怎么做呢?
【问题讨论】:
标签: apache-spark recommendation-engine apache-spark-mllib