【发布时间】:2011-07-22 12:57:46
【问题描述】:
所以我经常在一台不智能的佳能多功能机上运行大量的双面扫描作业,这给我留下了一个巨大的 JPEG 文件夹。考虑使用 PIL 分析图像文件夹以检测空白页扫描并将其标记为删除,我是不是疯了?
撇开文件夹抓取和标记部分,我想这看起来像:
- 检查图像是否为灰度,因为这是不确定的。
- 如果是,请检测主要的阴影范围(背景颜色)。
- 如果不是,请检测主要的色调范围,仅限于浅灰色。
- 确定整个图像的百分比由所述阴影组成。
- 尝试找到一个阈值,以充分检测带有文字、文字或图像的页面。
- 也许一次测试图像的片段以提高阈值的准确性。
我知道这是一种极端情况,但任何有 PIL 经验的人都可以指点一下吗?
【问题讨论】:
标签: python computer-vision python-imaging-library imaging image-scanner