opsky1733

       现在还有很多“程序猿”、“产品汪”不知道ocr是什么,因为确实这一直是个很冷门的东西,除非有需要用到这个技术,否则谁也不会去关注这方面的信息。但是您公司也需要ocr的,您知道么?下面就由小编来给各位IT行业的精英介绍一下吧!

  OCR英文全称Optical Character Recognition,光学字符识别,是指电子设备(例如扫描仪或数码相机)针对印刷体字符的文件进行取图,采用光学的方式+计算机程序将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。说白了就是“图片文字识别”!

  现在图片文字识别技术真的很厉害,对于扫描仪,高拍仪以及像素数非常高的智能手机拍照取得的图片,文字的识别率可以高达99%。

  还记得,上大学的时候,有个同学在学工组勤工俭学,帮老师做些教辅类的工作,当时,他跟我说有3本挺厚的书需要转为电子版,我当时也很傻也很天真的问他:

  “那你得用好久才干的完吧?”

  “不会用很久,我有简便的方法,不用自己敲很多字”

  我说:“啥方法?”

  只见,他用自己的手机拍了书的一页纸,然后用数据线将照片导入到电脑,电脑直接打开了一个软件,然后将图片导入到那个程序,我看了一下,貌似是学校的一个不知名的管理系统,然后他打开了一个功能,“To- Txt”,然后在弹出来的窗口中导入了图片,点了个“转换”按钮,我有注意到,窗口的右下角有一排字,“本插件由北京文通科技有限公司提供”。然后他就真的不用手敲了,全部都是电子文档了,我当时对这个软件技术真是惊呆了。

  那会儿还是2007年,想不到就有这么了不起的技术,他说如果这会儿有扫描仪的话就更方便了,我就不用来回导图片了,直接在电脑上操作。

  ↑

  后来,我也有幸从事ocr行业方面的工作了,才发现其实很多时候公司企业都会用得到图片文字识别这个功能,来辅助办公提高工作效率。 有的公司在档案管理业务环节,OA行政办公环节,工业自动化流程内,财务发票核验环节,公司往来业务文件管理环节,人事测评管理环节,企业信息化体系建设……等需要人工转录图片文字数据的时候,都可以用到。

  2015年7月份,有个生产牙膏的制造厂的客户 ,牙膏外包装壳都有一些产品简介的文字,有的时候生产作业中间出现错误,导致文字没有打印上去,那么这一批都会出问题;现在是靠人来检查的,这个人员配备可有可无,比较尴尬。

  后来给他们公司集成了“SDK 11”,在生产作业线上配备了一台照相机进行定时拍照,只要照片识别结果联系几个外壳都没有检测到应有的文字,那么就会触发预警功能,提示相关人员进行检查。

  之前有个专门给*做保密文档管理服务的公司技术总监找到了我,他说有个客户想要把公司内的扫描仪、复印机、打印机里的数据提取出来,监控公司人员使用这些机器的数据,主要是想监控防泄密的数据是否曾在这些机器中被使用过,将来好及时的调查泄密源头并找到泄密的部门和可能的人员。但是这个总监比较头痛,他们得到的机器里的图片都是五花八门的,而且角度都不统一,最后,还是我给他推荐的“sdk 11”帮了他的大忙,这个程序牛叉啊,就牛叉在Ta有自动旋正功能 ,而且识别率非常高 ,还可以识别西方文字 可不能小看这个自动旋正功能哦,这个可是专利技术,很多公司生产扫描仪都要购买这个技术呢。

  至于什么档案数字化、资料数字化、文书数字化这种小儿科的集成应用,我就不提了,太稀松平常了。现在ocr图片文字识别技术已经可以无孔不入的渗入到公司企业的各个业务环节中,只要你们想得到,就可以来尝试应用!

  不过我提个醒:那个什么网站注册验证码,登录验证码,支付验证码这种搞的人眼看起来都费劲的,就别想ocr了;还有那种艺术字,做的是真漂亮,然并卵,您还是高抬贵手别为难ocr程序了。

分类:

技术点:

相关文章: