【问题标题】:OCR Tessearct Scanning Chunks of text not left to right iOSOCR Tesseract 扫描文本块不是从左到右 iOS
【发布时间】:2014-01-29 03:30:53
【问题描述】:

我有一张要扫描的纸,但是该纸的格式不适合从左到右扫描。到目前为止,即使某些文本没有“组合”在一起,它也会从左到右扫描。

如何让 Tesseract 识别分组的文本并将分组的文本一起扫描,而不是从左到右扫描?

图片(不能发布低代表图片)

http://cdn.designrshub.com/wp-content/uploads/2012/06/alignment.jpg

例如,我如何让它识别这四个段落中的每一个都是它自己的“块”并分别扫描它们?而不是扫描两个顶部段落中的第一行,然后从那里向下扫描。

【问题讨论】:

    标签: ios ocr tesseract


    【解决方案1】:

    在 Tesseract 中,您可以在需要扫描的图像中输入帧。因此,如果您设置段落的框架,它将仅扫描该特定区域并返回该区域中的文本。因此,您可以单独扫描每个段落。

    转到 Tesseract.mm 文件并在其中添加此代码。

    - (void)setRect:(CGRect)rect {
         _tesseract->SetRectangle(rect.origin.x, rect.origin.y, rect.size.width, rect.size.height);
    }
    

    转到 Tesseract.h 文件并定义方法:

    - (void)setRect:(CGRect)rect;
    

    那么你可以在调用recognizedText之前设置frame

    [tesseract setRect:CGRectMake(0, 0, 100, 100)];
    [tesseract recognizedText];
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-09-23
      • 2022-01-05
      • 1970-01-01
      • 1970-01-01
      • 2014-02-24
      • 1970-01-01
      • 2012-04-21
      • 2013-06-28
      相关资源
      最近更新 更多