【发布时间】:2019-11-26 04:06:32
【问题描述】:
仅使用以下每个功能模板来实现 CountVectorizer 和 TfIdTransformer。我有训练、开发、测试数据。
这是我的样本火车数据:
Train_dataset = ['This is country of srilanka','This was very much', ' hi bro how are you']
一个。仅表示具有二进制值的单词出现(基线)。
湾。删除停用词(这些是英语中最常见的词)。
C。表示词的词频。
【问题讨论】:
标签: python-3.x machine-learning sentiment-analysis