【问题标题】:NLP translation giving me sentence translations instead of word translationNLP 翻译给我句子翻译而不是单词翻译
【发布时间】:2021-12-13 18:30:01
【问题描述】:

我使用来自http://www.manythings.org/anki/ 的葡萄牙语-英语数据集训练了一个变形金刚。这是一个并行化的句子数据集。

训练结束后,我尝试将“doente”这个词翻译成“sick”,但结果却是“我感到恶心”。

关于我如何得到生病这个词的任何想法?

我是否使用错误的数据集训练我的模型?基于句子而不是基于单词?

提前通知

【问题讨论】:

    标签: nlp translation


    【解决方案1】:

    机器翻译通常适用于句子,因为使用单词的上下文会改变其含义。逐字翻译没有意义。

    所以会发生的是,你的词doente通常出现在英文翻译为I feel sick的句子中;那是最小的上下文。由于这些都只是机器的字符,因此从人类的角度来看,没有“理解”只有 sick 部分对应于 doente

    如果要翻译单词,请使用双语词典;我怀疑是否存在基于单词的模型,因为数十年的机器翻译研究表明,您需要更大的语言块来翻译,而不仅仅是单词。

    【讨论】:

    • 嗨奥利弗,谢谢你的回复。所以只是一个简单的问题,谷歌是如何做到的?你知道他们的方法吗? NLP 不是我的研究领域,我只是为了好玩而尝试做一些类似于谷歌翻译的事情。
    • 我不知道 google 到底是怎么做的,但一种常见的方法是向机器学习系统提供并行文本,其中一个句子是另一个句子的翻译;这样就建立了映射,但不是逐字逐句的。但是,它确实适用于句子片段,而不仅仅是完整的句子。
    猜你喜欢
    • 2017-11-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-11-18
    相关资源
    最近更新 更多