【发布时间】:2017-04-11 03:16:03
【问题描述】:
我有一个 2 列的 excel 表:
- 单词 2. 语言
每一行只有一个单词,它直接链接到一种语言
我如何将这些单词和语言格式化为机器学习可接受的数据?
我正在使用 scikit-learn 并考虑过词袋,但在我看来,每个词的索引并不能传达每个词的特征。
【问题讨论】:
-
你的分类任务是什么?你想成为训练好的系统的输入输出是什么?
-
@Hossein 任务是将给定的单词分类为英语或荷兰语。
标签: python machine-learning scikit-learn