【发布时间】:2025-12-23 05:30:16
【问题描述】:
我有多个 tf*idf 向量,我想将它们与一个关联类与我的训练数据配对,以便在 sci-kit learn 中与 SVM 一起使用。有没有一种 sci-kit 方法可以将一个类与一个词向量配对以在我的训练阶段使用?
【问题讨论】:
标签: python machine-learning scikit-learn svm text-classification
我有多个 tf*idf 向量,我想将它们与一个关联类与我的训练数据配对,以便在 sci-kit learn 中与 SVM 一起使用。有没有一种 sci-kit 方法可以将一个类与一个词向量配对以在我的训练阶段使用?
【问题讨论】:
标签: python machine-learning scikit-learn svm text-classification
您尝试做的正是您在使用机器学习时不想要做的。如果您将手动将一组特征与输出类相关联,那么您所做的与过去的统计方法没有什么不同。机器学习的重点是将特征集与输出类的关联自动化。我们让机器确定输入中的哪些模式应该与某些类相关联。
您应该构建数据集,以相同的方式对所有实例进行矢量化。然后,您将该矩阵提供给您的 SVM 模型,SVM 将确定放置边界的位置,以便您的类在由您的特征定义的超空间中区分。
【讨论】: