【发布时间】:2015-01-11 17:18:35
【问题描述】:
我对 tesseract 和 openCV 还是很陌生。我正在构建一个简单的 Linux 应用程序来口述纸上的打印文本。使用 tesseract 我设法进行文本块识别,但是如果文本块中有一个整数,则该数字将被省略。例子 输入: “你好,这是我 2014 年的 1080p 3D 视频” 输出: “你好,这是我的 1080p 3D 视频”
有人遇到过这个问题吗?
openCV:2.4.9 正方体:V3.02 莱普托尼卡:1.71 操作系统:Ubuntu 64bit 14.04 LTS
问候
【问题讨论】:
-
你是否可靠地在其他包含纯数字的句子上重复了这一点?注意 3D 和 1080p 工作,所以我认为训练数据不是问题。
标签: linux opencv ubuntu ocr tesseract