【发布时间】:2015-12-13 19:52:18
【问题描述】:
我正在尝试将电影分为两个任意类别。我得到了这部电影的情节提要及其类型。当我使用 TfidfVectorizer 将我的概要转换为特征时,我需要使用电影的类型作为单独的特征。
我目前只是将流派附加到概要的文本中并将其提供给分类器。
问题在于这两个功能是不同类型的。虽然单词被转换为 tfidf 矩阵,但我觉得应该区别对待该类型,而不仅仅是像任何其他单词一样。无论如何我可以做到这一点吗?
【问题讨论】:
标签: scikit-learn classification