【发布时间】:2020-10-07 18:24:16
【问题描述】:
我是计算机视觉方面的新手,目前正在学习使用 Go 的谷歌云视觉 SDK。现在我有一个问题。
所以我有一张使用DetectTexts() method 扫描的图像。结果很棒!扫描所有文本。
但是,我实际上并不需要所有这些文本。我只需要其中的一部分。下面是我用作示例的图像。我想得到的是用红色突出显示的两个块。
图片
结果
WE-2
Sam WHO
Time
PM 1:57
SYS
mmHg
mmHg
DIA
mmHg
90
62
82
mmHg
PUL
/MIN
MR AVGA
SET
START
STOP
MEM
我不知道最好的方法是什么。我现在想到的是这些方法:
- 分割以红色突出显示的图像,然后对这些新图像执行 OCR 扫描
- 或者,获取所有文本,然后使用某种算法(也许是 NLP?)来获取突出显示的文本。
有人可以帮助解决这个问题的正确和最佳方法是什么吗?
【问题讨论】:
-
您可以在识别之前屏蔽图像。例如,在红色矩形内使用等于 0 且在其外部等于 255 的掩码进行逻辑 OR。
标签: machine-learning google-cloud-platform computer-vision ocr