【发布时间】:2017-05-10 04:22:35
【问题描述】:
我正在尝试从视频中创建硬编码的字幕翻录器。
到目前为止,我已经做了一些预处理。
- 获取字幕框
- 裁剪字幕行
- 单独的字幕行
- 单独的字符。
字符识别的主要部分还没有完成。我尝试使用 tesseract,但准确率约为 60%。我也尝试训练角色图像,然后比较它们。但是当我在不同分辨率的视频上运行时,它失败了。
以下是目前的结果。 (原图、阈值、文本增强、分隔字符)
我确实使用了 K 均值并使用 Structural Similarity 比较图像。但在我的情况下没有任何效果。如上图所示,文字非常清晰。
已编辑:
问题:我想将准确率提高到 95% 或以上,因为所有视频中的文本都相似,我能够获得如上所示的明文或字符。在我的情况下,我可以尝试哪些最佳方法?
P.S: 语言是克罗地亚语
【问题讨论】:
-
看起来你得到了不错的结果!不过你实际上并没有问过问题——你在问什么?
-
@ChristopherShroba:已编辑问题。
-
你试过tesseract吗?
-
@Miki:是的,正如问题所提到的,tesseract 并不适合我的情况。
-
哦,我错过了……但是,通过适当的预处理和正确的字典,应该比 60% 更好地工作