【问题标题】:Can I feed translations back to Google Cloud Translation API to train it?我可以将翻译反馈给 Google Cloud Translation API 来训练它吗?
【发布时间】:2018-02-17 13:30:49
【问题描述】:

我通过 SDL Trados 中的 Google Cloud Translation API 使用 Google Translate 神经网络(惊人的改进)来处理技术翻译。

当然,它需要大量的后期编辑,主要是术语,有时还有风格。我真的很想神经网络可以从这篇文章编辑中学习——但似乎没有办法将我的编辑反馈回来。 手动使用网络界面 (translate.google.com) 时是可能的。 (多年未更新)谷歌翻译工具包允许使用共享的公共 TM,但现在神经网络已经过时了。

我可以以某种方式将翻译反馈给 Google Cloud Translation API 来训练它吗?

他们的FAQ 声明如下:

“Google 是否将我的数据用于培训目的?

不,Google 不会使用您翻译的内容来训练和改进我们的机器翻译引擎。为了提高机器翻译的质量,Google 需要平行文本 - 内容以及该内容的人工翻译。”

【问题讨论】:

  • @fozziethebeat,你怎么看?

标签: google-translate


【解决方案1】:

正如您所指出的,在the documentation regarding confidentiality 中,由于以下原因,Google 不会将用于培训目的的数据用作背景/透明流程:

  • 保密性:出于保密原因,输入到 Translation API 的内容不会用于训练模型。
  • 不可行: Translation API 背后的神经网络模型需要未翻译的内容加上用户建议的翻译版本,以便为模型添加一些训练;因此无法仅使用未翻译的文本来训练模型。

此外,目前无法建议对 API 的翻译以便以更自定义的方式训练模型。

附带说明一下,您可能有兴趣关注 AutoML,这是 Google Cloud Platform 的新产品,目前为 still in alpha,但您可以通过填写主页中的表格申请访问.它将允许创建自定义机器学习模型,而无需其他更复杂的产品(例如 ML Engine)所需的奉献精神和专业知识。 AutoML 系列的第一个推出的产品将是 AutoML Vision,但类似的产品可能会出现在平台中的一些其他 ML 相关 API,例如 Translation API,哪个是你感兴趣的。

还可以随时访问Google Cloud Big Data and Machine Learning Blog,以便随时了解该领域的最新消息。如果您对 AutoML 感兴趣,它的发布和演示可能也会在博客中发表。

总结一下:不,目前您无法将建议的翻译反馈给 Translation API,但将来您或许可以这样做,或者至少拥有自己的自定义模型。

【讨论】:

  • 感谢您的链接 :) 好吧,第一点可以通过实际选择来解决(显然,如果我不关心数据的机密性,我只会选择加入),第二点很容易解决Trados / 任何 CAT 工具,通过反馈翻译的 TU。
  • 尽管是有效积分,但遗憾的是目前在 Translation API 中没有这样的功能。无论如何,如果您觉得值得让 Translation API 团队知道这一点,您可以file a Feature Request via the corresponding Public Issue Tracker。您对此还有其他疑问吗?
  • 谢谢,我完全忘记了问题跟踪器!
  • 我很高兴能帮上忙。请consider accepting (and upvoting) the answer if you think it solves your question,这样社区就会知道你的问题已经解决了。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2019-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-11-08
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多