【发布时间】:2017-07-12 18:31:23
【问题描述】:
我使用 TF-IDF 来影响体重,这可以帮助我构建我的字典。但我的模型还不够好,因为我有非结构化文本。
关于 TF-IDF 类似算法有什么建议吗?
【问题讨论】:
标签: data-mining sentiment-analysis text-analysis
我使用 TF-IDF 来影响体重,这可以帮助我构建我的字典。但我的模型还不够好,因为我有非结构化文本。
关于 TF-IDF 类似算法有什么建议吗?
【问题讨论】:
标签: data-mining sentiment-analysis text-analysis
当你说,你的模型不够好,是不是说明你生成的字典不够好?提取关键术语并使用 TF-IDF 权重构建字典实际上是特征选择步骤。
要为您的模型提取或选择特征,您可以采用其他方法,如主成分分析、潜在语义分析等。机器学习中的许多其他特征选择技术也很有用!
但我真的相信对于情感分类任务,TF-IDF 应该是一个非常好的构建字典的方法。我宁愿建议你在训练时调整模型参数,而不是责怪特征选择方法。
还有许多深度学习技术适用于您的目标任务。
【讨论】: