【问题标题】:Google Cloud Vision - Fails to provide good OCR on image with 2 columns of textGoogle Cloud Vision - 无法在具有 2 列文本的图像上提供良好的 OCR
【发布时间】:2017-11-14 09:21:57
【问题描述】:

当我将双列文本图像传递给谷歌云视觉 API 的 TEXT_DETECTION/DOCUMENT_TEXT_DETECTION 时,双列文本的输出顺序不正确,因为它从第一列获取一行,然后从另一列获取下一行并附加它。

你可以看到输出的结果没有按照双列的顺序正确对齐。有没有办法纠正来自谷歌视觉 API 的结果,或者使用 JSON 文件输出纠正它?

To view input image in JPG[click here]

输出-

6.6 医疗保健访问时间。 [56] 视力障碍可以用来识别附近的人 6.6 医疗保健通道 没有他们说一句话。152||视力障碍有能力 对健康和福祉产生影响。视力障碍是 尤其是在老年人中增加。人们认识到,那些 6.5.3 沟通发展 有视力障碍的人可能无法获得信息和医疗保健 设施,和视觉障碍可以对de-产生深远的影响 可能无法得到最好的照顾,因为并非所有的发展 婴儿和儿童的交流。 lan- 医疗保健专业人员是 了解儿童的特定需求调节和社会发展,或 婴儿可以迟到视力。因看不见而耽误了时间 他们周围的世界。 .有效医疗保健的先决条件 很好地让员工意识到人们可能会遇到问题 有远见。社会发展 社会发展包括: 在交流中与婴儿周围的人互动 以及能够开始其生命的不同方式。给孩子 用视力,用微笑与视障人士交流 客户必须父母是认可和交流的第一个标志 可根据个人需求量身定制,适用于所有阳离子,并且是 几乎是即时的沟通因素。对于视障人士 婴儿,父母的声音的识别将被注意到 大约两个月大,但微笑只会被唤起 7 流行病学父母和婴儿之间的接触。这种主要形式 孩子的沟通会大大延迟,并且会阻止其他人 发展中的交流方式。社交互动 世界卫生组织 估计 2012 年有 2.85 亿 因为微妙的视觉线索是错失视觉障碍的人 世界,其中 246 种来自他人的 miling 和面部表情 丢失。狮子视力低下,3900 万人失明。 [4]由于延误 在孩子的沟通发展中,90%的失明者 生活在发展中的他们似乎对社交不感兴趣 与世界的活动。 [56] 全世界每个盲人平均 3.4 人有 视力低下,与国家和地区的其他人交流。 这可能导致孩子的变异范围从 2.4 到 5.5。 [57]成为 被同龄人回避,因此受到过度保护 按年龄:视觉 家庭成员对损伤的分配不均。跨年龄 团体。超过 82% 的盲人年龄在 50 岁以上 年龄更大,尽管他们只占世界人口的 19% 人口。由于视觉上的语言发展,很多东西 是预期的失明年数(blind years),由 孩子是通过模仿别人学会的,童年失明 仍然是一个重大问题,作为一个视障儿童 以下估计有 140 万盲童需要非常有计划 年龄 15. 针对延迟 imi- 发展的结构 性别:现有研究一致表明这一点。一种 视力受损的婴儿可能会喋喋不休地模仿每个区域 世界,在各个年龄阶段,女性说话的时间都比有视力的人早 孩子,但可能会出现延迟 明显更高的视觉风险 与组合单词来表达自己相比,孩子可能 男性。倾向于提出很少的问题,并且他们对形容词的使用是 不常见。通常,孩子的感官体验是按地理划分的: 视觉障碍不是分布式的,不容易编码成 语言,这可能使他们在世界范围内正式。更多的 超过 90% 的人将短语和句子存储在他们的记忆中并重新 世界上的视障者生活在发展中国家。 [57] 泥炭 你离题了。盲童的语言 1990 年代,基于 发展对 2002 年全球人口的了解表明, 数字世界,而是他们的语言知识 盲人或视力障碍者,以及其他人。谁是 对传染病的影响视而不见,但 A 视力受损 孩子也可能对探索数量的增加犹豫不决 由于恐惧而对周围世界视而不见的人 未知和与更长寿命相关的条件。 157||也可能是 过度保护不鼓励勘探- 1987 年,据估计 那598,000人的家庭成员。没有混凝土 经验表明,美国符合盲人的法律定义。 是的孩子不能发展有意义的概念或这个 数,58% 的年龄在 65.581 岁以上 1994 年-用语言来描述 或者想想他们。 55] 1995 年,130 万美国人报告合法 失明。 159|

【问题讨论】:

  • FWIW 我注意到 ABBYY 在检测列方面要好得多,但在 ocr 方面并不准确。

标签: android json google-cloud-platform ocr google-cloud-vision


【解决方案1】:

现在云视觉支持多栏文档,提供更好的阅读顺序。

https://cloud.google.com/vision/docs/fulltext-annotations

【讨论】:

    【解决方案2】:

    您可以使用 DOCUMENT_TEXT_DETECTION 查找不同的块/段落,然后对响应进行统一处理。

    请在此处找到对文档的完整参考: https://cloud.google.com/vision/docs/ocr

    【讨论】:

    • Armonize?这甚至是一个词吗?
    猜你喜欢
    • 2020-11-05
    • 2018-05-23
    • 1970-01-01
    • 2019-02-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-07-24
    • 2020-07-26
    相关资源
    最近更新 更多