【问题标题】:Image recognition for Payment bills支付账单的图像识别
【发布时间】:2018-02-06 19:13:33
【问题描述】:

我想从账单图像中提取有用的信息。

我已经使用 OCR + pytesseract 将图像转换为文本,并根据总数、金额等特定单词提取信息。

处理各种类型的非结构化票据以提取票据的地点和金额的最佳通用方法是什么?

【问题讨论】:

  • 能否提供一些图片?
  • 我认为您可能已经成功提取了这张图片中的账单,但在非结构化图片中,您可以使用正则表达式匹配来根据货币符号和数字过滤账单数据。
  • 是的,我正在使用正则表达式进行提取。但我的挑战是处理 OCR 无法正确转换为文本的劣质图像和徽标。
  • 如果您的图像模糊,其中像素数据丢失或被遮挡,那么您将无法以任何方式获取丢失的信息。

标签: image-processing ocr pytesser


【解决方案1】:

在非结构化、旋转、平移、光变图像识别的情况下,最好使用深度学习模型。

首先使用包含不同类型变化的 n 个图像来训练您的网络。

例如,假设我们需要找到“金额”一词的位置:

图片1:右上角有“金额”字样的账单图片

图片2:左上角带有“金额”字样的账单图片

....

这些将是您的输入训练样本。您的输出将是单词“数量”的位置坐标。

您可以查看this 链接以了解有关创建深度学习模型的更多信息。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-05-03
    • 1970-01-01
    • 1970-01-01
    • 2018-10-26
    • 1970-01-01
    • 2018-08-06
    • 1970-01-01
    • 2010-11-14
    相关资源
    最近更新 更多