【发布时间】:2016-12-27 20:50:51
【问题描述】:
我正在努力使用词袋/词汇方法来将我的输入数据表示为我在 keras 中的神经网络模型的一个热向量。
我想构建一个简单的 3 层网络,但我需要帮助来理解和开发一种方法来以文本形式转换我的标记数据,有 7 个标签的情感,步骤范围为 0 - 1 0.2。
我曾尝试使用 scikit 的矢量化器,但它们过于死板,即它们要么对单词或字符进行标记,而我需要将一个句子与包括单词、字符、标点符号和表情符号的词汇表进行比较。当我在测试句子上使用 tfid 时,它只计算单词并忽略其他所有内容。我还需要有关采用这种热门方法以及如何在 keras 中实施的指导。
【问题讨论】:
标签: python nlp keras text-classification