【发布时间】:2014-12-04 09:36:06
【问题描述】:
我正在使用 tesseract OCR 来识别视频帧的文本。
我编写了一个程序,使用 ffmpeg 获取视频的所有主要帧,并裁剪它们(使用静态值)以使文本居中(例如,字幕)。
我还使用 ImageMagick 和 TextCleaner 脚本,它们像魔术一样提高了 OCR 的质量!
不管怎样,有时我的视频质量不太好,或者视频尺寸有点小,或者裁剪不居中的文本(因为值是 staitc),并且 OCR 结果非常糟糕。
我的问题是:如何检测文本在完美裁剪中的正确位置? 这应该会提高 OCR 的质量并获得更好的结果。
任何建议将不胜感激。谢谢。
【问题讨论】:
-
您能否添加(链接到)两个帧样本:一个“好”,一个“坏”(需要检测文本位置)?
-
如果文本始终在彩色框中,这将是一个重要的细节。如果盒子总是更蓝的话。
标签: php imagemagick ocr tesseract