【问题标题】:How to handle newline characters in translated text?如何处理翻译文本中的换行符?
【发布时间】:2020-09-30 23:46:02
【问题描述】:

我正在使用自定义翻译器将俄语文本翻译成英语。有些句子包含\n 字符,表示换行符。我的目标是翻译文本,就像其中没有换行符一样,但我想保留这个\n

示例 俄语:

очередь, к которой отнесен обработчик и в которой зарегистрированы данные, которые он будет обрабатывать.

英文翻译:

处理程序分配到的队列以及它所分配的数据 将进程注册

这段文字可以在不同的地方有\n

очередь, к которой отнесен обработчик и в которой зарегистрированы данные, которые он будет\nобрабатывать。 очередь, к которой отнесен обработчик и в которой зарегистрированы данные\n которые он будет обрабатывать。 очередь, к которой отнесен обработчик и в которой\nзарегистрированы данные, которые он будет обрабатывать。

并且所有翻译都应该匹配第一个,但保留 '\n' 位置。

有可能吗?我尝试将\n 替换为<BR> ,但翻译不同。

【问题讨论】:

  • 您可以将不同的句子作为json数组中的不同项提交给翻译api。然后你可以在翻译后重新组合你的句子

标签: microsoft-translator


【解决方案1】:

哇!找到了解决方案!
需要将\n替换为<b> </b>

【讨论】:

    【解决方案2】:

    我找不到一种优雅的方法。但是,找到了解决方法。您可以将“\n”替换为完全不同的脚本中的一些单词或字符,并且翻译人员保持原样,而不会对翻译产生任何影响。取回翻译后的文本后,您可以将虚拟词替换为“\n”。

    我翻译了

    очередь, к которой отнесен обработчик и в которой зарегистрированы данные, которые он будет मुखपृष्ठ обрабатывать。 очередь, к которой отнесен обработчик и в которой зарегистрированы данные मुखपृष्ठ которые он будет обрабатывать。 очередь, к которой отнесен обработчик и в которой मुखपृष्ठ зарегистрированы данные, которые он будет обрабатывать.

    它给了我

    处理程序分配到的队列以及它的数据所在的位置 将मुखपृष्ठ过程记录。处理程序所在的队列 分配,其中将处理的数据मुखपृष्ठ是 记录下来。处理程序分配到的队列以及 मुखपृष्ठ 记录了它将处理的数据。

    这里我使用了一个“印地语”词“मुखपृष्ठ”,但您可以尝试使用日语之类的词。

    重复一遍,这只是我目前发现的一种解决方法,不知道这是否足以适用于各种用例,或者它是否在未来继续有效。

    【讨论】:

    • 感谢您的回答!是的,我认为可能的方法是找到一些不会影响翻译的字符,并且自定义翻译器将保持不变。但在您的示例中,翻译不同:and where the data that it will process is recorded and in which the data which it will process is recorded and in which the recorded the data that it will process.
    • 这可能会影响翻译质量,我不推荐这种方法
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2017-09-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-04-01
    • 2012-02-08
    • 1970-01-01
    相关资源
    最近更新 更多