Google Cloud Vision - 无法在具有 2 列文本的图像上提供良好的 OCR答案

【问题标题】：Google Cloud Vision - Fails to provide good OCR on image with 2 columns of textGoogle Cloud Vision - 无法在具有 2 列文本的图像上提供良好的 OCR
【发布时间】：2017-11-14 09:21:57
【问题描述】：

当我将双列文本图像传递给谷歌云视觉 API 的 TEXT_DETECTION/DOCUMENT_TEXT_DETECTION 时，双列文本的输出顺序不正确，因为它从第一列获取一行，然后从另一列获取下一行并附加它。

你可以看到输出的结果没有按照双列的顺序正确对齐。有没有办法纠正来自谷歌视觉 API 的结果，或者使用 JSON 文件输出纠正它？

To view input image in JPG[click here]

输出-

6.6 医疗保健访问时间。 [56] 视力障碍可以用来识别附近的人 6.6 医疗保健通道没有他们说一句话。152||视力障碍有能力对健康和福祉产生影响。视力障碍是尤其是在老年人中增加。人们认识到，那些 6.5.3 沟通发展有视力障碍的人可能无法获得信息和医疗保健设施，和视觉障碍可以对de-产生深远的影响可能无法得到最好的照顾，因为并非所有的发展婴儿和儿童的交流。 lan- 医疗保健专业人员是了解儿童的特定需求调节和社会发展，或婴儿可以迟到视力。因看不见而耽误了时间他们周围的世界。 .有效医疗保健的先决条件很好地让员工意识到人们可能会遇到问题有远见。社会发展社会发展包括：在交流中与婴儿周围的人互动以及能够开始其生命的不同方式。给孩子用视力，用微笑与视障人士交流客户必须父母是认可和交流的第一个标志可根据个人需求量身定制，适用于所有阳离子，并且是几乎是即时的沟通因素。对于视障人士婴儿，父母的声音的识别将被注意到大约两个月大，但微笑只会被唤起 7 流行病学父母和婴儿之间的接触。这种主要形式孩子的沟通会大大延迟，并且会阻止其他人发展中的交流方式。社交互动世界卫生组织估计 2012 年有 2.85 亿因为微妙的视觉线索是错失视觉障碍的人世界，其中 246 种来自他人的 miling 和面部表情丢失。狮子视力低下，3900 万人失明。 [4]由于延误在孩子的沟通发展中，90%的失明者生活在发展中的他们似乎对社交不感兴趣与世界的活动。 [56] 全世界每个盲人平均 3.4 人有视力低下，与国家和地区的其他人交流。这可能导致孩子的变异范围从 2.4 到 5.5。 [57]成为被同龄人回避，因此受到过度保护按年龄：视觉家庭成员对损伤的分配不均。跨年龄团体。超过 82% 的盲人年龄在 50 岁以上年龄更大，尽管他们只占世界人口的 19% 人口。由于视觉上的语言发展，很多东西是预期的失明年数（blind years），由孩子是通过模仿别人学会的，童年失明仍然是一个重大问题，作为一个视障儿童以下估计有 140 万盲童需要非常有计划年龄 15. 针对延迟 imi- 发展的结构性别：现有研究一致表明这一点。一种视力受损的婴儿可能会喋喋不休地模仿每个区域世界，在各个年龄阶段，女性说话的时间都比有视力的人早孩子，但可能会出现延迟明显更高的视觉风险与组合单词来表达自己相比，孩子可能男性。倾向于提出很少的问题，并且他们对形容词的使用是不常见。通常，孩子的感官体验是按地理划分的：视觉障碍不是分布式的，不容易编码成语言，这可能使他们在世界范围内正式。更多的超过 90% 的人将短语和句子存储在他们的记忆中并重新世界上的视障者生活在发展中国家。 [57] 泥炭你离题了。盲童的语言 1990 年代，基于发展对 2002 年全球人口的了解表明，数字世界，而是他们的语言知识盲人或视力障碍者，以及其他人。谁是对传染病的影响视而不见，但 A 视力受损孩子也可能对探索数量的增加犹豫不决由于恐惧而对周围世界视而不见的人未知和与更长寿命相关的条件。 157||也可能是过度保护不鼓励勘探- 1987 年，据估计那598,000人的家庭成员。没有混凝土经验表明，美国符合盲人的法律定义。是的孩子不能发展有意义的概念或这个数，58% 的年龄在 65.581 岁以上 1994 年-用语言来描述或者想想他们。 55] 1995 年，130 万美国人报告合法失明。 159|

【问题讨论】：

FWIW 我注意到 ABBYY 在检测列方面要好得多，但在 ocr 方面并不准确。

标签： android json google-cloud-platform ocr google-cloud-vision

【解决方案1】：

现在云视觉支持多栏文档，提供更好的阅读顺序。

https://cloud.google.com/vision/docs/fulltext-annotations

【讨论】：

【解决方案2】：

您可以使用 DOCUMENT_TEXT_DETECTION 查找不同的块/段落，然后对响应进行统一处理。

请在此处找到对文档的完整参考： https://cloud.google.com/vision/docs/ocr

【讨论】：

Armonize？这甚至是一个词吗？