【发布时间】:2019-12-18 21:30:50
【问题描述】:
我正在使用goodbooks-10k dataset 来制作推荐系统。我想使用书籍的标签来提出建议。书的标签以一种加重的方式出现 - 对于每本书和每个标签,都有一行包含书名、标签名称以及此标签在这本书中出现的次数。 数据集如下所示:
我想使用这些信息来构建标签的词袋表示,其中对于每个标签,我都有一个列,其中包含该标签在给定书籍中出现的次数。
用 pandas 实现这一点的正确方法是什么?
提前致谢!
【问题讨论】:
-
图片链接很有用,但由于它比较简单,您能否将数据剪切并粘贴到您的问题中,以便我们快速参考?您可以使用 3 个反引号 ``` 来制作代码/数据块。
-
dt.tag_id.value_counts()
标签: python pandas dataframe scikit-learn one-hot-encoding