【问题标题】:Pytesseract is too slow.. High disk I/OPytesseract 太慢了。。高磁盘 I/O
【发布时间】:2019-09-21 12:18:02
【问题描述】:

我正在为视频游戏创建一个机器人,一切正常 (thanks to some stackoverflow members),但 pytesseract 响应时间太长。

我必须每秒阅读picture of this kind(在将其编辑为黑白后,非常快速的过程,不需要时间)。

我正在做的是将图片分成9个,每行一个,然后为每个调用pytesseract.image_to_string(img)

这个过程大约需要 3 秒,考虑到文本很短,我认为它可以更快。

我注意到 Process Hacker 中的磁盘 I/O 很高,请参见以下屏幕截图:Disk I/O

最后一点,我感觉以管理员身份执行python脚本会好一些,但我不确定也不够..

您有我可以实施的解决方案以使其更快吗?

【问题讨论】:

    标签: tesseract python-tesseract


    【解决方案1】:

    您需要使用 tesseract api 而不是 pytesseract,每次运行 ocr 时都会初始化 tesseract(例如读取训练数据)(并将 ocr 图像存储到磁盘并从磁盘读取 ocr 结果...)。例如看看https://github.com/zdenop/SimpleTesseractPythonWrapper/blob/master/SimpleTesseractPythonWrapper.ipynb

    【讨论】:

    猜你喜欢
    • 2016-07-28
    • 2019-12-07
    • 2014-05-20
    • 1970-01-01
    • 1970-01-01
    • 2021-12-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多