【发布时间】:2015-11-25 01:48:59
【问题描述】:
从事从给定图像中检索内容并与存储库中的其他图像进行比较并列出匹配图像的项目。
应该采取什么正确的方法来做到这一点,以便搜索最终不会变慢。
作为第一级过滤,我计划做的是使用任何图像查询(CBIR 技术)来检索与给定图像模式匹配的图像。 然后进行 OCR 获取图片内容并进行匹配检查。
如果有更好的方法,请告诉我。
【问题讨论】:
从事从给定图像中检索内容并与存储库中的其他图像进行比较并列出匹配图像的项目。
应该采取什么正确的方法来做到这一点,以便搜索最终不会变慢。
作为第一级过滤,我计划做的是使用任何图像查询(CBIR 技术)来检索与给定图像模式匹配的图像。 然后进行 OCR 获取图片内容并进行匹配检查。
如果有更好的方法,请告诉我。
【问题讨论】:
完成的步骤
软件 1. 正方体 OCR 2. Image Magick - 用于图像清洁 3.Textcleaner脚本
使用Image Magick软件找出图像方向
对图像进行 OCR 以获取文本并应用过滤以获取账单编号、日期和金额。
保存的数据用于将来的搜索功能以消除重复
【讨论】: