【问题标题】:How can I analyze a nonstructured text?如何分析非结构化文本?
【发布时间】:2017-07-12 18:31:23
【问题描述】:

我使用 TF-IDF 来影响体重,这可以帮助我构建我的字典。但我的模型还不够好,因为我有非结构化文本。

关于 TF-IDF 类似算法有什么建议吗?

【问题讨论】:

    标签: data-mining sentiment-analysis text-analysis


    【解决方案1】:

    当你说,你的模型不够好,是不是说明你生成的字典不够好?提取关键术语并使用 TF-IDF 权重构建字典实际上是特征选择步骤。

    要为您的模型提取或选择特征,您可以采用其他方法,如主成分分析、潜在语义分析等。机器学习中的许多其他特征选择技术也很有用!

    但我真的相信对于情感分类任务,TF-IDF 应该是一个非常好的构建字典的方法。我宁愿建议你在训练时调整模型参数,而不是责怪特征选择方法。

    还有许多深度学习技术适用于您的目标任务。

    【讨论】:

      猜你喜欢
      • 2019-07-29
      • 1970-01-01
      • 2011-08-18
      • 2017-12-19
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-11-23
      • 1970-01-01
      相关资源
      最近更新 更多