【发布时间】:2012-02-26 15:25:06
【问题描述】:
我指的是基于软件的 OCR ?图像到文本引擎的转换工具,stackoverflow 有大量关于构建 OCR 的帖子,但我看起来相反,就像任何关于如何保护我的图像免受逆向工程的指导。
例如,我有只包含文本的图像,我怎样才能让任何人都难以解码数据,是否有任何所需的图像格式可以做到这一点?或者我们可以混淆图像?
使用特殊字体或变形可以保证 OCR 保护吗?虽然我的要求不允许提供太多扭曲的文本。
任何方向都会很有帮助
【问题讨论】:
-
您是否正在寻找 CAPCHA 来验证登录名以避免垃圾邮件?如果是这样,您应该使用现有组件。或者您是否尝试发布文档并希望避免被扫描?如果是这样,我敢肯定 OCR 引擎已经足够先进,以至于任何 OCR 证明的东西都会让你的观众阅读起来太烦人了。
-
@HenryJackson - 你猜对了,我正在发布长文档供人们阅读。为什么你说 OCR 证明方法很烦人?如果这需要对低级编程进行高端研究,不妨试一试。
-
如果你能读懂它,你就可以(理论上)对它进行 OCR。
-
@aldrin 你是对的,这就是为什么 captcha.net 和 Google 的图像如此模糊以至于人类也难以阅读。