【发布时间】:2015-06-04 16:22:08
【问题描述】:
我有大约 4000 万个 TIFF 文档,都是 1 位单页双面打印。在大约 40% 的情况下,这些 TIFF 的背面图像是“空白”的,我想在加载到 CMS 之前删除它们以减少空间需求。
是否有一种简单的方法可以查看每个页面的数据内容,如果它低于预设阈值,例如 2% '黑色',则将其删除?
我对这个技术不了解,但 C# 解决方案可能是最容易支持的。问题是,我没有图像处理经验,所以真的不知道从哪里开始。
编辑添加:这些图像是旧扫描件,因此“脏”,所以这不是一门精确的科学。需要设置阈值以避免误报。
【问题讨论】: