【发布时间】:2011-08-14 11:43:13
【问题描述】:
我试图找到一个关于统计机器翻译如何工作的高层次解释。也就是说,假设我有一个不对齐的英语、法语和德语文本的语料库,我怎么能用它来将任何句子从一种语言翻译成另一种语言?我并不是想自己构建一个谷歌翻译,但我想更详细地了解它是如何工作的。
我在 Google 上看到过搜索结果,但没有找到任何好东西,它要么很快需要高级数学知识才能理解,要么过于笼统。维基百科关于 SMT 的文章似乎两者兼而有之,因此并没有太大帮助。我怀疑这是一个如此复杂的领域,如果没有所有的数学知识就根本无法理解。
谁能给出或知道这样一个系统如何工作的一般分步解释,针对程序员(所以代码示例很好),但不需要数学学位来理解?或者像这样的书也很棒。
编辑:我正在寻找的一个完美示例是等效于 Peter Norvig's great article on spelling correction 的 SMT。这很好地了解了编写拼写检查器所涉及的内容,而无需深入了解 Levenshtein/soundex/平滑算法等的详细数学......
【问题讨论】:
-
我有点困惑。您是否建议机器翻译有效?请详细说明...
-
您可能已经看过它,但 Google 有一个视频概述了它是如何“工作”的:translate.google.com/about/intl/en_ALL 我认为这非常好,而且是外行。 HTH
标签: language-agnostic machine-translation