PSENet核心点笔记

looking for papers for PSE

同步发布位置：https://github.com/leoluopy/paper_discussing

contributer : leoluopy

欢迎提issue.欢迎watch ，star.
微信号：leoluopy，如有疑问，欢迎交流，得文时浅，或有纰漏，请不吝指教。

Overview

PSENet核心点笔记

在字符检测领域，传统的矩形框方法难以检测到不规则形状的文字，但在自然环境中这种情况广泛存在，因此基于分割的字符检测方法应运而生
- 基于分割的字符检测方法在任意形状文字检测上取得了良好效果，但是在字符间距很小时容易出现粘连问题。本文介绍的方法基于以下贡献点解决该问题
- 设计了多个尺度的特征图卷积核，从最小尺寸的特征图卷积核依次膨胀得到最后结果解决了粘连问题
- 使用图像腐蚀方法生成了若干训练数据，不需要单独标注
- 在各个数据集都取得了state-of-art成绩

效果描述

PSENet核心点笔记

由图可见在IC15,IC17,CTW1500上，PSENet在Precesion, Recall, F1-Score都取得了不错的成绩。

模型结构叙述

PSENet核心点笔记

PSE网络结构受FPN启发，首先经过若干卷积提取多个尺度的特征图，这里是４个尺度的特征图(P5 P4 P3 P2)
特征图经过上下采样得到融合后的特征图F
单个特征图F被采样处理为多个尺度的特征图卷积核（Sn Sn-1 S1）
在这些特征图卷积核上做最后的分割预测

分割预测的膨胀过程

PSENet核心点笔记

在多个特征图预测得到各自尺度的分割结果后，这些结果需要融合以下是融合过程的概述：
- 从最小尺度的特征图结果开始融合，依次往最大特征图运算
- 如果有分割结果冲突，遵从先到先占位原则进行融合

消融研究

PSENet核心点笔记

m : 缩放比例(最小/原始)　[由图可见，过大或者过小的m都对性能提升不利，取0.5左右的m,能对性能起到贡献]
n : 预测特征图个数 [可以看到从预测特征图的逐步增加，F1-Score逐步提升，n=4时到达拐点，n对于性能的提升起到了重要作用]

训练及Loss设计

label生产

PSENet核心点笔记

上图介绍了标签生成的规则
- d 是两个GT之间的缩进距离
- r 缩放的比例，和m,n有关系，预测特征图越小，r越小
- Area是求面积函数
- Perimeter是求周长函数

Loss

PSENet核心点笔记

Loss由两部分构成，普通分割Lc和缩放膨胀部分Ls
λ控制两部分Loss权重

PSENet核心点笔记

Si 是预测像素值
Gi 是标注像素值
M (Online Hard Example Mining) 训练过程中将部分简单样本和小数量样本进行抑制，提高训练效率,点我更多信息
Si 是对应尺度预测图的预测像素值
Gi 是对应尺度生成的标注像素值
Si > 0.5 时，W 取 1 , 其他情况　W 取 0

通过这种方式，W过滤掉对应尺度特征图上被腐蚀掉的目标部分。加速训练过程，个人认为如果没有W,应该也能训练出相当的效果，欢迎拍砖

相关文章：

2021-11-28
2021-11-28
2021-11-22
2021-05-03
2021-11-03
2022-01-10
2021-09-29
2021-07-15

猜你喜欢

2021-07-26
2021-11-12
2022-12-23
2021-11-18
2022-12-23
2021-09-13
2021-07-22

相关资源

下载 2023-02-06
下载 2023-03-29
下载 2022-12-31

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode