【发布时间】:2014-01-29 03:30:53
【问题描述】:
我有一张要扫描的纸,但是该纸的格式不适合从左到右扫描。到目前为止,即使某些文本没有“组合”在一起,它也会从左到右扫描。
如何让 Tesseract 识别分组的文本并将分组的文本一起扫描,而不是从左到右扫描?
图片(不能发布低代表图片)
http://cdn.designrshub.com/wp-content/uploads/2012/06/alignment.jpg
例如,我如何让它识别这四个段落中的每一个都是它自己的“块”并分别扫描它们?而不是扫描两个顶部段落中的第一行,然后从那里向下扫描。
【问题讨论】: