支付账单的图像识别答案

【问题标题】：Image recognition for Payment bills支付账单的图像识别
【发布时间】：2018-02-06 19:13:33
【问题描述】：

我想从账单图像中提取有用的信息。

我已经使用 OCR + pytesseract 将图像转换为文本，并根据总数、金额等特定单词提取信息。

处理各种类型的非结构化票据以提取票据的地点和金额的最佳通用方法是什么？

【问题讨论】：

【解决方案1】：

在非结构化、旋转、平移、光变图像识别的情况下，最好使用深度学习模型。

首先使用包含不同类型变化的 n 个图像来训练您的网络。

例如，假设我们需要找到“金额”一词的位置：

图片1：右上角有“金额”字样的账单图片

图片2：左上角带有“金额”字样的账单图片

....

这些将是您的输入训练样本。您的输出将是单词“数量”的位置坐标。

您可以查看this 链接以了解有关创建深度学习模型的更多信息。

【讨论】：