【发布时间】:2018-05-12 15:53:48
【问题描述】:
我正在创建一个机器学习模型,该模型基本上将一个文本的正确性返回给另一个文本。 例如; “猫和狗”,“狗和猫”。该模型需要能够识别某些词(“cat”/“dog”)比其他词(“a”/“the”)更重要/重要。我对连词等不感兴趣。我希望能够告诉模型哪些词最“重要”,并让它确定文本 1 对文本 2 的正确程度,用“重要的”词比其他词更重要。
它还需要能够识别短语不一定必须以相同的顺序排列。上面两句应该是非常匹配的。
我应该使用什么基本算法来解决这个问题?除了创建一个包含数千个示例文本和正确分数的数据集之外,还有其他选择吗?
我只是在广泛的概述/流程图/流程/算法之后。
【问题讨论】:
标签: tensorflow machine-learning text nlp artificial-intelligence