【语义分割】Paper Reading-CCNet

文章：CCNet: Criss-Cross Attention for Semantic Segmentation（ICCV2019

论文地址：https://arxiv.org/abs/1811.11721

论文代码：https://github.com/speedinghzl/CCNet

Abstract：

对于每个像素采用十字的路径来获取上下文信息；再进一步递归使得每个像素都能获得全局所有像素点的long-range depandence。（本文的方法是一种获得上下文信息的方法）

优点：

1.GPU内存友好

2.高计算效率

3.SOTA

Cityscapes ADE20Kmiou: 81.4, 45.22

代码：https://github.com/speedinghzl/CCNet.

Intro：

作者认为基于FCN的很多model都存在受局限于感受域与short-range上下文信息的情况；不能获得充足的环境信息。

为了扩大感受域，Deeplab用ASPP，PSPNet用金字塔池化模型，PSANet用attention map；但是空洞卷积只能从少数周围的像素中得到稀疏的信息；而基于池化的方法是无适应的方法、从所有像素中获得同质的环境信息，不能满足不同的像素需要不同的环境依赖的需求。全局的attention map难免计算量颇大((H*W)*(H*W))

【语义分割】Paper Reading-CCNet