【问题标题】:Does Tesseract's page segmentation mode 1 (-- psm 1) have the same effect as deskewing images?Tesseract 的页面分割模式 1 (--psm 1) 和图片去歪斜效果一样吗?
【发布时间】:2022-03-16 01:27:30
【问题描述】:

Tesseract 提供了一个参数来设置页面分割模式(-- psm)
下面是所有模式,如documentation所示:

Page segmentation modes:
  0    Orientation and script detection (OSD) only.
  1    Automatic page segmentation with OSD.
  2    Automatic page segmentation, but no OSD, or OCR.
  3    Fully automatic page segmentation, but no OSD. (Default)
  4    Assume a single column of text of variable sizes.
  5    Assume a single uniform block of vertically aligned text.
  6    Assume a single uniform block of text.
  7    Treat the image as a single text line.
  8    Treat the image as a single word.
  9    Treat the image as a single word in a circle.
 10    Treat the image as a single character.
 11    Sparse text. Find as much text as possible in no particular order.
 12    Sparse text with OSD.
 13    Raw line. Treat the image as a single text line,
                        bypassing hacks that are Tesseract-specific.

-- psm 1 是否与校正图像然后使用例如-- psm 3?

【问题讨论】:

标签: image-processing ocr tesseract


【解决方案1】:

根据我的经验,PSM 1 和 PSM 3 将文本歪斜了 90、180、270 度,尽管 PSM 1 只这样做了。但是,您可能会注意到在某些情况下,PSM 1 可能会在分段期间遗漏一些文本。如果文本未按行对齐并且字体大小不同,则可能会发生这种情况。但总的来说,不要期望 Tesseract 会检测到不在 0、90、180 或 270 度范围内的文本方向。此外,您需要一个通常 >= 50 个字符的字符数。 :)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2015-09-22
    • 1970-01-01
    • 2017-05-23
    • 2011-08-05
    • 2014-02-03
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多