【发布时间】:2019-07-17 16:23:29
【问题描述】:
我正在 scikit learn 中使用线性 SVM 执行二进制分类任务。我使用名义特征和词向量。我使用预训练的 Google word2vec 获得了词向量,但是,我不确定 SVM 如何将词向量作为特征来处理。
似乎我需要将每个向量“拆分”为 300 个单独的特征(= 300 个向量维度),因为我无法将向量作为一个整体传递给 SVM。但这似乎不对,因为向量应该被视为一个特征。
在这种情况下,表示向量的正确方法是什么?
【问题讨论】:
标签: python classification svm word2vec