【问题标题】:Multi feature recommender system representation多特征推荐系统表示
【发布时间】:2012-09-03 12:57:09
【问题描述】:
我希望扩展我的推荐系统以包含其他功能(维度)。到目前为止,我正在跟踪用户如何评价某些文档,并使用它来进行推荐。我有兴趣添加更多功能,例如用户位置、年龄、性别等。
到目前为止,一些 mysql 表已经足够处理这个问题,但我担心随着我添加更多功能它会很快变得混乱。
我的问题:我怎样才能最好地表示和保存这种多维数据?
Python 的特定技巧会很有帮助。
谢谢
【问题讨论】:
标签:
python
numpy
scipy
data-mining
【解决方案1】:
我推荐使用张量,它是多维数组。您可以使用任何数据表或简单的文本文件来存储张量。每一行或每一行都是一个记录/交易,其中列出了不同的功能。
【解决方案2】:
在您的情况下,SQL 数据库应该可以正常工作。事实上,您可以将所有训练示例存储在一个数据库中,每一行代表一个特定的训练集,每一列代表一个特征。您可以在需要时通过添加列来添加功能。在关系数据库中,由于各种不一致的原因,您可能会在查询数据时遇到访问错误。尝试使用 NoSQL 数据库。我个人在 python 上使用 MongoDB 和 Pymongo 将训练示例存储为 JSON 格式的字典。 (这种方式更容易用于网络应用程序)。