机器学习学习笔记（十六）—— 图像识别中的应用

以OCR识别举例：

一个OCR识别程序通常包括四个步骤：图像检测、图像分割、文字识别、错误纠正。

第一步，图像检测(滑动窗分类器/sliding windows)：

比如检测图片中的行人，我们定义一个比例一定的方块，然后每次截取一块图片进行输入，并且每次以一定的步长(step size/stride parameter)来截取图片。然后调整滑动窗的大小，再次扫描图片。。。

机器学习学习笔记（十六）—— 图像识别中的应用

机器学习学习笔记（十六）—— 图像识别中的应用

第二步，图像分割：

训练一个分类器，看是否文字之间有空隙.

相关文章：

2021-10-05
2021-12-27
2021-12-25
2021-09-01
2021-10-29
2021-12-25
2021-09-16
2021-06-05

猜你喜欢

2021-04-28
2022-02-09
2021-09-02
2021-08-10
2022-12-23
2021-07-13
2021-04-03

相关资源

下载 2023-02-06
下载 2021-06-26
下载 2023-04-03
下载 2023-02-14

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode