1、模型需求
- 考虑需要判断高校与纪委的舆情正负面,需构建三个模型A、B、C
-
**模型A**:构建一个针对`高校`的正负面分类模型。
-
**模型B**:构建一个针对`纪委`的正负面分类模型。
-
**模型C**:构建一个区分`纪委和高校`的分类模型
如果后期有其他需求,如添加商品评价的正负面判断。则增加一个商品评价的正负面判断模型,并将模型C重新训练为一个三类分类器。
2、数据集收集
-
**数据集A**: 收集`高校相关`的正负面舆情 (初始正负面各2W、再逐步扩增)
-
**数据集B**: 收集`纪委相关`的正负面舆情 (初始正负面各2W、再逐步扩增)
-
**数据集C**: 收集`高校和纪委`的舆情 (初始正负面各2W、再逐步扩增)
3、数据集标注
- **数据集A**: 对舆情情感倾向的`正负面`分别标注为`1、0`
- **数据集B**: 对舆情情感倾向的`正负面`分别标注为`1、0`
- **数据集C**: 高校舆情,纪委舆情分别标注为`1、0`
4、数据预处理
- 数据清洗
- 舆情数据长度的填充和截断
5、搭建模型
先上一个简单网络模型,看效果,再根据效果调整模型,确认最优模型。