【发布时间】:2017-12-11 09:07:26
【问题描述】:
我经常使用 Google 的 Vision OCR,它确实非常准确。我想知道是否可以对视频文件或视频流进行 OCR。比如说,我有一些监控视频,我想获取整个视频中的所有文本。在谷歌的视频智能 API 中,我只能获取标签,我猜这是使用谷歌视觉的标签检测 API。我认为 OCR 在视频的每一帧上都可能存在挑战,但仍然想尝试开始讨论如何完成它。可能没有完美的解决方案,但即使我们得到了 50%,也总比没有好。
【问题讨论】:
-
如果我们首先通过连接在不同帧中捕获的部分文本来重建包含文本的表面,则将获得最佳结果。然后结合同一表面段的几个镜头,我们可以摆脱 mpeg 伪影等。
-
@Nakilon 你能详细说明一下吗?我只得到了一部分。如何连接在不同帧中捕获的部分?我只能获取包含部分的文本。但是跟踪!?
-
您需要为此找到解决方案。 Google 不提供此类服务。
-
好的。会试一试的。
标签: video google-cloud-platform ocr google-cloud-vision