【问题标题】:Translate language for multiple pdf to english将多个 pdf 的语言翻译成英文
【发布时间】:2021-01-01 00:02:49
【问题描述】:

我有一组俄文的 pdf 文档,我需要将它们翻译成英文。我需要自动化这个活动。

目前我将文档上传到谷歌翻译并进行翻译,但这样做需要很多时间并且不可扩展。

【问题讨论】:

  • 你有什么问题?
  • 有些 pdf 中有图片,我需要先将它们转换为可编辑的文本 pdf,然后将文本的语言从俄语翻译成英语。目前这个过程是手动完成的,需要很多时间。我有责任自动执行此任务,但我不知道如何处理此任务。
  • 这是在 Office 365 上完成的吗?如果没有,您可以使用哪些平台或工具?
  • 我在 sharepoint 上获取文件。我可以使用的工具/平台是自动电源、PDF Xchange 编辑器、office、python
  • 目前我使用 PDF Xchange 编辑器 OCR 将文件从“图像 pdf”转换为“文本 pdf”,然后手动将这些文件保存到目录中,然后我将每个文件一一上传到谷歌翻译进行转换从俄语到英语的语言。

标签: python automation ui-automation power-automate


【解决方案1】:

(注意:我不熟悉翻译文档,但这应该可以让您的基本架构朝着正确的方向发展)。

根据我们的简短交流,我建议探索如下流程:

这样,您将使用 SharePoint 列表托管文档,当添加文档时,Power Automate 流将触发并翻译然后重新编写文档。您可以使用 Microsoft 的内部提取和翻译软件(或自动化步骤/操作),也可以将 HTTP 请求发送到您想要的任何客户端。谷歌搜索翻译或文本提取 API 会发现几个选项,包括谷歌翻译。

如果您对使用 Google 翻译(或其他)没有任何要求,我个人会坚持使用相同品牌的技术,这样与外部客户合作时就不会那么头疼了……但当然可以了无论您的要求是什么。您可以使用“HTTP”操作发起 HTTP 请求。


在 Power Automate 中,您将使用“创建项目时”SharePoint 触发器,然后使用 Encodian 的“从图像中提取文本”(或根据您的文件类型而有所不同)。

然后,只需获取输出并将其扔到 Microsoft 翻译,或将 HTTP 请求发送到您想要的任何地方

然后,您可以将翻译后的输出写入任何您想要的位置,另一个 SharePoint 列表、数据库、电子邮件等等。

好链接

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-02-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多