【问题标题】:What's a good explanation of statistical machine translation?统计机器翻译的好解释是什么?
【发布时间】:2011-08-14 11:43:13
【问题描述】:

我试图找到一个关于统计机器翻译如何工作的高层次解释。也就是说,假设我有一个不对齐的英语、法语和德语文本的语料库,我怎么能用它来将任何句子从一种语言翻译成另一种语言?我并不是想自己构建一个谷歌翻译,但我想更详细地了解它是如何工作的。

我在 Google 上看到过搜索结果,但没有找到任何好东西,它要么很快需要高级数学知识才能理解,要么过于笼统。维基百科关于 SMT 的文章似乎两者兼而有之,因此并没有太大帮助。我怀疑这是一个如此复杂的领域,如果没有所有的数学知识就根本无法理解。

谁能给出或知道这样一个系统如何工作的一般分步解释,针对程序员(所以代码示例很好),但不需要数学学位来理解?或者像这样的书也很棒。

编辑:我正在寻找的一个完美示例是等效于 Peter Norvig's great article on spelling correction 的 SMT。这很好地了解了编写拼写检查器所涉及的内容,而无需深入了解 Levenshtein/soundex/平滑算法等的详细数学......

【问题讨论】:

  • 我有点困惑。您是否建议机器翻译有效?请详细说明...
  • 您可能已经看过它,但 Google 有一个视频概述了它是如何“工作”的:translate.google.com/about/intl/en_ALL 我认为这非常好,而且是外行。 HTH

标签: language-agnostic machine-translation


【解决方案1】:

这是一个精彩的视频讲座(分为 2 部分):

http://videolectures.net/aerfaiss08_koehn_pbfs/

对于深入的细节,我强烈推荐这本书:

http://www.amazon.com/Statistical-Machine-Translation-Philipp-Koehn/dp/0521874157

两者都来自创建了研究中使用最广泛的 MT 系统的人。它涵盖了所有基本的东西,解释得很好而且准确。这可能是该领域的任何研究人员都应该阅读的事实上的标准书籍之一。

【讨论】:

    【解决方案2】:

    The Atlantic Online 早在 1998 年 12 月就对统计机器翻译进行了非常直截了当的非技术性描述:

    Lost in Translation by Stephen Budiansky

    我以前读过关于统计 MT 的非技术性内容,但一直想知道“是的,但是当词序不同并且假定没有使用字典和语法时,统计内容如何知道哪些词映射到哪个词?”嗯,这篇文章实际上确实回答了这个问题,而且它简单明了,我很惊讶。

    【讨论】:

      【解决方案3】:

      2007 年 Google 开发者日的 Peter Norvig 演讲 Theorizing from Data: Avoiding the Capital Mistake 包含对统​​计机器翻译原理的一些易于理解的高级解释(从大约 21:20 开始)。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2021-05-18
        • 2014-09-26
        • 2015-07-14
        • 2010-10-09
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多