有幸接触到了tesseract,然后上网找了张验证码,直接扔给tesseract识别,发现识别不了,如下图

tesseract+opencv进行验证码识别

于是使用opencv进行处理之后再用tesseract识别,结果如下图

tesseract+opencv进行验证码识别

首先读入图片

 
  1. Mat src = imread("test.png");

  2. if (src.empty())

  3. return -1;

  4. imshow("src", src);

tesseract+opencv进行验证码识别

灰度转换

 
  1. Mat gray;

  2. cvtColor(src, gray, CV_BGR2GRAY);

tesseract+opencv进行验证码识别

二值化

 
  1. //二值化

  2. Mat binaryMat;

  3. threshold(~gray, binaryMat, 100, 255, THRESH_OTSU);

  4. Mat verticalMat;

  5. binaryMat.copyTo(verticalMat);

tesseract+opencv进行验证码识别

然后想着现在这张图能不能识别了,于是把二值化之后的图片甩给tesseract识别,发现还是识别不了

tesseract+opencv进行验证码识别

进行形态学操作

 
  1. //定义形态学算子

  2. int verticalSize = verticalMat.rows / 30;

  3. Mat verticalKernel = getStructuringElement(MORPH_RECT, Size(1, verticalSize));

  4. erode(verticalMat, verticalMat, verticalKernel);

  5. dilate(verticalMat, verticalMat, verticalKernel);

tesseract+opencv进行验证码识别

查找轮廓,根据轮廓大小筛选,去除一些小的噪声

 
  1. //寻找轮廓

  2. vector<vector<Point>>contours;

  3. vector<vector<Point>>detectorContours;

  4. findContours(verticalMat, contours, RETR_LIST, CHAIN_APPROX_SIMPLE);

  5. for (int i = 0;i < contours.size();i++)

  6. {

  7. //默认轮廓较大的是验证码

  8. if (contours[i].size() > 50)

  9. detectorContours.push_back(contours[i]);

  10. }

  11. Mat printMat = Mat::zeros(src.size(),CV_8UC1);

  12. drawContours(printMat, detectorContours, -1, Scalar::all(255),-1);

tesseract+opencv进行验证码识别

现在应该差不多了,甩给tesseract识别

tesseract+opencv进行验证码识别

成功识别

相关文章: