array(2) {
  ["docs"]=>
  array(10) {
    [0]=>
    array(10) {
      ["id"]=>
      string(3) "428"
      ["text"]=>
      string(77) "Visual Studio 2017 单独启动MSDN帮助（Microsoft Help Viewer）的方法"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(8) "DonetRen"
      ["tagsname"]=>
      string(55) "Visual Studio 2017|MSDN帮助|C#程序|.NET|Help Viewer"
      ["tagsid"]=>
      string(23) "[401,402,403,"300",404]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400964"
      ["_id"]=>
      string(3) "428"
    }
    [1]=>
    array(10) {
      ["id"]=>
      string(3) "427"
      ["text"]=>
      string(42) "npm -v；报错 cannot find module "wrapp""
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "zzty"
      ["tagsname"]=>
      string(50) "node.js|npm|cannot find module &quot;wrapp“|node"
      ["tagsid"]=>
      string(19) "[398,"239",399,400]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400760"
      ["_id"]=>
      string(3) "427"
    }
    [2]=>
    array(10) {
      ["id"]=>
      string(3) "426"
      ["text"]=>
      string(54) "说说css中pt、px、em、rem都扮演了什么角色"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(12) "zhengqiaoyin"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400640"
      ["_id"]=>
      string(3) "426"
    }
    [3]=>
    array(10) {
      ["id"]=>
      string(3) "425"
      ["text"]=>
      string(83) "深入学习JS执行--创建执行上下文（变量对象，作用域链，this）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "Ry-yuan"
      ["tagsname"]=>
      string(33) "Javascript|Javascript执行过程"
      ["tagsid"]=>
      string(13) "["169","191"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511399901"
      ["_id"]=>
      string(3) "425"
    }
    [4]=>
    array(10) {
      ["id"]=>
      string(3) "424"
      ["text"]=>
      string(30) "C# 排序技术研究与对比"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "vveiliang"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(8) ".Net Dev"
      ["catesid"]=>
      string(5) "[199]"
      ["createtime"]=>
      string(10) "1511399150"
      ["_id"]=>
      string(3) "424"
    }
    [5]=>
    array(10) {
      ["id"]=>
      string(3) "423"
      ["text"]=>
      string(72) "【算法】小白的算法笔记：快速排序算法的编码和优化"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "penghuwan"
      ["tagsname"]=>
      string(6) "算法"
      ["tagsid"]=>
      string(7) "["344"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511398109"
      ["_id"]=>
      string(3) "423"
    }
    [6]=>
    array(10) {
      ["id"]=>
      string(3) "422"
      ["text"]=>
      string(64) "JavaScript数据可视化编程学习（二）Flotr2，雷达图"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "chengxs"
      ["tagsname"]=>
      string(28) "数据可视化|前端学习"
      ["tagsid"]=>
      string(9) "[396,397]"
      ["catesname"]=>
      string(18) "前端基本知识"
      ["catesid"]=>
      string(5) "[198]"
      ["createtime"]=>
      string(10) "1511397800"
      ["_id"]=>
      string(3) "422"
    }
    [7]=>
    array(10) {
      ["id"]=>
      string(3) "421"
      ["text"]=>
      string(36) "C#表达式目录树（Expression）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "wwym"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(4) ".NET"
      ["catesid"]=>
      string(7) "["119"]"
      ["createtime"]=>
      string(10) "1511397474"
      ["_id"]=>
      string(3) "421"
    }
    [8]=>
    array(10) {
      ["id"]=>
      string(3) "420"
      ["text"]=>
      string(47) "数据结构 队列_队列实例：事件处理"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "idreamo"
      ["tagsname"]=>
      string(40) "C语言|数据结构|队列|事件处理"
      ["tagsid"]=>
      string(23) "["246","247","248",395]"
      ["catesname"]=>
      string(12) "数据结构"
      ["catesid"]=>
      string(7) "["133"]"
      ["createtime"]=>
      string(10) "1511397279"
      ["_id"]=>
      string(3) "420"
    }
    [9]=>
    array(10) {
      ["id"]=>
      string(3) "419"
      ["text"]=>
      string(47) "久等了,博客园官方Android客户端发布"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(3) "cmt"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511396549"
      ["_id"]=>
      string(3) "419"
    }
  }
  ["count"]=>
  int(200)
}
222<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="utf-8" />
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta http-equiv="content-language" content="zh-CN" />
<meta http-equiv="X-UA-Compatible" content="IE=edge" /> 
    <title>【机器学习】李宏毅——卷积神经网络CNN - 爱码网</title>
     
<meta name="keywords" content="机器学习" />
<meta name="description" content="目录ECharts异步加载ECharts数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。chart.setOption({    color: [" />
<meta name="viewport" content="width=device-width, initial-scale=1.0" />
<link rel="stylesheet" type="text/css" href="/statics/css/base.css?v=2.7" />
<script src="/statics/js/detail.min.js?v=2.2"></script>   
<script>
   $(document).ready(function () { 
		$("img").error(function () {
			$(this).hide();
		}); 
	}); 
</script>
</head>
<body class="home-template dtpg">
<nav class="main-nav clearfix">
    <div class="inner">
        <ul class="nav">
            <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/" title="爱码网">首页</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/1.html" title="前端技术">前端技术</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/9.html" title="编程语言">编程语言</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/31.html" title="人工智能">人工智能</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/41.html" title="运维知识">运维知识</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/52.html" title="资源下载">资源下载</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/68.html" title="常用小工具">常用小工具</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/72.html" title="技术问答">技术问答</a></li>
                    </ul>            
	 
    </div>
</nav><div class="site-wrapper">
 
    <header style="height: auto;padding: 10px 0px;" class="main-header">
        <div style="max-width:910px" class="main-header-content inner">
                        <h1 class="page-title"><a href="/show-308638387.html" title="【机器学习】李宏毅——卷积神经网络CNN">【机器学习】李宏毅——卷积神经网络CNN</a></h1>
            
        </div>

    </header>
    <main class="content" role="main">
	

        <div class="leftbox">
    <article class="post tag-uifont tag-webview">
        <header class="post-header">
            <footer class="tc"> FavoriteStar 
                <time class="post-date" datetime="2022-12-23">2022-12-23</time>
            </footer>
        </header>
        <section class="post-content">
            <div class="contentbef">  
                  
                              </div>

            
    <!--done-->
    <div id="topics">
        <div class="post">
            
            
            <div class="postBody">
                    <div id="likecs_post_description" style="display: none">
        <img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjeU1ESXpMbU51WW14dlozTXVZMjl0TDJKc2IyY3ZNamsyTmpBMk55OHlNREl5TVRJdk1qazJOakEyTnkweU1ESXlNVEl4TlRJek5ETXdNalU1TWkweU1UWTRNVEEwTkRFdWNHNW4=" alt="【机器学习】李宏毅——卷积神经网络CNN" class="desc_img">
        【机器学习】李宏毅——卷积神经网络CNN，讲解了其过程和原理
    </div>
<div id="likecs_post_body" class="blogpost-body cnblogs-markdown">
<p>CNN我们可以从两个角度来理解其中的具体过程</p>
<h3 id="neuron-version-story解释版本1">Neuron Version Story(解释版本1)</h3>
<p>对于图像分类，其具体的流程如下所示：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpGbU5UTmpaVGc0Tm1Zd09UUTFPREE0TURJMk9EazJNR0pqTmpNM01HUTRMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>将一张图像作为模型的输入，输出经过softmax之后将与理想向量用交叉熵的形式进行比较。那么<strong>如何将图片作为模型的输入呢？</strong></p>
<p>实际上每张图片都是<strong>三维的张量</strong>，两维表示长宽，一维表示通道（RGB），那么就<strong>可以将这个张量拉长成一个向量，就可以作为模型的输入了，该向量的每一个元素都是对应像素在对应通道上的取值</strong>。</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51TDJReE5tVTJOV0UxTldFNFpUUTNaak5oT1RSaU1XUTVORFJsWlRVNU1XWTNMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>那么如果将上述的向量输入到一个全连接的网络中：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpnM01ERTVNRFpqTkRSaU5UUTRZelU0TmpFeU9EUmtOMkk1TW1Ga01EVTNMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p><strong>可以看到参数量非常的巨大！</strong>，因此我们应该尝试来进行简化！</p>
<h4 id="观察现象1">观察现象1：</h4>
<p>假设我们a当前在分辨一张图片是不是一只鸟的时候，<strong>我们并不用将整张图片完全都进行阅读与处理，实际上我们只需要找这张图片有没有出现关于鸟的关键性特征，例如鸟嘴、鸟的爪子等等</strong>，因此可以从这个思想进行简化</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51TDJNM056ZGtZekpoTlRJM09EUXdZV1U1T0dSbU9XRm1ObU13TnpGaE5HVTRMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<h4 id="简化方法1">简化方法1：</h4>
<p><strong>每一个神经元结点只看一部分区域的内容</strong>，例如：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpBNVlqVmpaRGc0TVRreU5qUXhNekk1Wm1abE1qRXdNamMzWm1FeU1EbG1MbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>那个神经元只需要接受该<span class="math inline">\(3\times 3\)</span>区域的信息，因此只需要将该区域展开成向量作为该神经网络的输入即可。<strong>并且多个神经元结点他们的观测区域是可以重叠的、不同的观测区域可以不同的大小、不同的通道等等</strong>。</p>
<h5 id="典型设置">典型设置</h5>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51TDJabU5EZzVZMlZoTmpWaFpEUmxNakZpWVRnd09EVm1ZemxrTkRnNE9USTRMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<ul>
<li>每一个观测区域都是观测全部通道，其大小称为<strong>kernel size</strong>，通常为<span class="math inline">\((3\times 3)\)</span>
</li>
<li>每一个观测区域通常不止有一个神经元结点在守卫，通常有多个，例如64、128</li>
<li>观测区域之间通常是有重叠的，例如上述<strong>stride</strong>就是距离，为2说明有1的交叠</li>
<li>如果在边界发现超出了范围，可以进行<strong>padding</strong>补值，那么可以补0或者均值等等</li>
</ul>
<h4 id="观察现象2">观察现象2：</h4>
<p>同一个特征可能出现在图片中的不同位置，例如下面两张图片的鸟嘴是出现在图片的不同区域的：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpVeE9HUmhZbVJsWmpNM1pUUTFZbUZpWWpjME5HWmxOR1JqTVdNeU0yVm1MbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>那么<strong>是不是我需要在每一个区域都放一个可以侦测鸟嘴的神经元才可以呢？</strong>可是侦测鸟嘴这件事情是<strong>重复的，只不过是出现在不同的区域</strong>，那么可以进行简化。</p>
<h4 id="简化方法2">简化方法2：</h4>
<p>那么既然所做的事情是一样的只不过是区域不同，<strong>那么就让这不同区域的都是侦测鸟嘴的神经元共享参数</strong>：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpVd01EWTVNVEV3TTJNME16Um1aalZpTjJFd1pqQmhOamcwTWpsaU5HVmtMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p><strong>这样就可以完成在不同区域检测同一个特征，同时减少参数量的目的</strong>。</p>
<h5 id="典型设置-1">典型设置</h5>
<p>结合我们前面所说的<strong>一个观测区域是由多个结点来守卫的</strong>，那么可以认为<strong>每个区域所拥有的神经元个数都相同，并且其中每一个神经元所侦测的特征也都相同，我们让其共享参数，也就全部区域都只有一组参数了</strong></p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpJeU1qazVaakkxTm1GaFlqUTNPR001TUdJek56TXdOalJrTkRGaVlqbGtMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>那么结合上面的各种方法，<strong>就把神经网络从全连接的范围减小到了卷积网络的范围</strong>，卷积神经网络的神经元满足上述的条件。因此可以看到<strong>因为范围小所以相对来说卷积神经网络的偏差是比较大的，但它是适用于特定的影像识别任务的</strong>。</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51TDJKaFlqTmtPRFZrTlRjd1pqUTVObVppT0RreU4yUmtaREZoWlRabE0yWTVMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<h3 id="filter-version-story解释版本2">Filter Version Story(解释版本2)</h3>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpRek1HRXpNakk0TXpFd09UUmpaVFU1WkRGa1pUZzBNMlE1TVdRMFlUa3dMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>这个角度是说，<strong>对于一层卷积层，我们有很多个Filter，可以认为每一个Filter都是为了侦测某一个特征，其大小为设为<span class="math inline">\((3\times 3 \times channel)\)</span>，而其中的参数就是我们通过学习得到的</strong>。假设我们已知参数，现在来看其工作过程。</p>
<p>对于每一个Filter，<strong>会扫描整张图片的所有区域，然后将对应元素相乘再求和得到一个数组</strong>，扫描之后所得到的矩阵<strong>就是该层Filter对图像的处理结果</strong>：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpBMVlUY3lZVE5tWkRJMFlUUTRObUU0TVdZMVpESTNNR1ZqTUdFME16TmxMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>那么如果有多个Filter，就可以得到多个类似的数值矩阵</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpnMU1HVTJOalU1WmpjNE1qUmxNelJoWmpNMk5qZzVOR1V5WW1Jd05UVmpMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>假设当前我们有64个Filter，那么得到的数值矩阵大小为<span class="math inline">\((4\times 4 \times 64)\)</span>，<strong>就可以将这个数值矩阵看成一个全新的图片，其长宽为<span class="math inline">\(4\times 4\)</span>，其通道数为64，再将其输入到下一层的卷积之中，那么下一层的Filter的大小就需要为<span class="math inline">\((3\times 3 \times 64)\)</span>了</strong>：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpZMk1HWTNNbU0wTldWak1UUTNaVGs1TnpSaVkyWTJOMk13TVRjd01UVTNMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>那么有一个问题是<strong>我们扫描的大小一直是<span class="math inline">\(3\times 3\)</span>，有没有可能出现扫描的区域太小导致没看到某个特征的全部的现象</strong>？可以看下图</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51TDJGak1tRTJaV05qWVRFeU5qUmxNalpoTTJFd1pEazNPVE00WlRBM05XTm1MbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p><strong>第二层仍然是<span class="math inline">\(3\times 3\)</span>，但是其扫描的是第一层的输出结果，其扫描的区域相对于原始图像矩阵来说就是<span class="math inline">\(5\times 5\)</span>，因此只要你层数足够，后面是可以一次性扫描整张图片的</strong>。</p>
<p>以上就是其工作流程。</p>
<p>这两种介绍方式的区别在于：</p>
<ul>
<li>第一种说Filter是共同参数，而第二种则是一个Filter扫描过每一个区域</li>
</ul>
<h4 id="观察现象3">观察现象3：</h4>
<p>如果对一张图，<strong>将其奇数行和奇数列拿掉，图片缩小为原来的四分之一，其特征是不会改变的，我们仍然可以很明显地看出是什么内容</strong>，这样缩小图片的大小称为pooling，可以有效地减小运算量。接下来介绍pooling具体怎么运行。</p>
<h4 id="poolingmax-pooling">pooling——max pooling</h4>
<p>对于前述从Filter得到的数值矩阵中，如果采用max pooling，那么就是<strong>将矩阵按照固定大小进行分组，然后每一组选出其中最大的数值来作为代表，这样就缩小了矩阵的大小</strong>，如下图：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51TDJSa1ltRTNZMlk1WTJVd01EUTBOVE01TWpnNVpESTJOalkyWVRWaFpETmtMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpGa05EUXdZMkk0TXpFNFl6UTJNV0U1TlRjME5XTTRaV013TnpZellUSXlMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>那么通常呢是在卷积之后就加上pooling，可以有效地减小计算量：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpFMll6WXpOakZsT0RkbU16UXdNV0poWlRjM05XWTBPRFF5TlRZM1lXVXpMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>但这样也会损失一定的精度，因此<strong>可以几层卷积之后再进行一次pooling</strong>。</p>
<h3 id="cnn的完整过程">CNN的完整过程</h3>
<p>经过前述的卷积+pooling，<strong>我们得到的是一个数值矩阵，那么如何从数值矩阵得到我们最终想要的判断类别的向量呢</strong>？请看下图：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51TDJFNFkyRTVZemN6TkdKbE1EUmxORFU1TXpRNE9HSXpNVFptTlRFMFlqVXdMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>因此完整过程为：</p>
<ul>
<li>将图像输入后经过反复的卷积和pooling后得到一个数值矩阵</li>
<li>将该数值矩阵<strong>Flatten</strong>，降成一个向量，作为一个全连接网络的输入</li>
<li>经过全连接网络的处理后的输出再经过一个softmax函数，得到最终的输出向量</li>
</ul>
<h3 id="spatial-transformer-layer">Spatial Transformer Layer</h3>
<p>由于CNN对于一些图像的特定操作不能够及时的反映出来，例如将训练时的物体进行放大、缩小、旋转等，CNN都很难能够及时地辨认出来，因此<strong>可在CNN之间加上一个特殊的转换层，这一层的目的在于能够将一些图片进行处理，处理成CNN能够辨识的样子</strong>，如下：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpKaU1HTTBObUV5WW1ReVlqUTNZVEU0WWpGbU1UZ3pZakl6TWpnMFpHTXhMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>而将该层的参数和CNN的参数一起训练就称为<strong>End-to-end learn</strong>。</p>
<h5 id="如何进行图像处理">如何进行图像处理</h5>
<p>具体的方式是<strong>将原始图像矩阵乘以一定的权重矩阵，得到目标图像矩阵</strong>，如下图：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpBMU5URmpNR1pqTjJVek1qUmtNRFZpWVdReU5EZ3hOVEU1WWpGaVpqWmtMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>通过合理地设置<span class="math inline">\(w^l_{nm,ij}\)</span>就可以使得原来矩阵的值往下移动。而其他的旋转等操作也是类似的，实际上<strong>可以看成是经过一层神经元来带来的操作</strong></p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpjek5qQTJOV05rWkRNMll6UTVNMkU0TWpFMFpESm1aalEzWm1ReE1UZGtMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<h5 id="常见转换">常见转换</h5>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51TDJFek5UWXhNbU13WVRBMFlUUmhPVFppWlRrek1EYzNNakkxWTJVeU5tTmhMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"><br><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpJd1lqaGtaamMwWWpBd01UUm1ZVGM1WVRrMFpHUTNPV1kwT0dKa1lXWTNMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>从上面可知，<strong>对于旋转、平移、缩放这些affine transformation，只需要六个参数来构成一个矩阵和一个向量，再将原始位置向量进行运算即可得出最终结果</strong>，因此可以认为<strong>将原始图像矩阵方法该层神经网络中将会输出六个参数构成矩阵和向量，然后再将原始矩阵和该参数进行计算即可得到目标图像</strong>：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpFeE1UTmlNemRoWW1FNU56UmlNVFE1WWpZd09UVXhNekF5WkRjNU5EY3lMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p><strong>这里的<span class="math inline">\([x,y]\)</span>和<span class="math inline">\([x`,y`]\)</span>代表的是索引！！</strong>，例如</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51TDJWaU5qTTVZVEV4TnpSak56UTVNRGhpTkRka1pUSmxaVFZqWmpNNU9HTTRMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>代入<span class="math inline">\([x,y]=[2,2]\)</span>，那么得到<span class="math inline">\([x`,y`]=[1,1]\)</span>也就是说</p>
<p></p>
<div class="math display">\[a^l_{22}=a^{l-1}_{1,1}
\]</div>
<p></p>
<p>但如果是下面这种情况：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51TDJZeU5EYzFOV0k1WkdNek16UmxaVFJpTVRJellXTTRaV1l3WldJeE1tRTNMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p>那么<strong>得到的索引不是整数，那么只能进行四舍五入</strong>。但这也就带来了问题</p>
<h6 id="这样的转换是否可以进行梯度下降求解参数">这样的转换是否可以进行梯度下降求解参数？</h6>
<p><strong>不可以！。梯度下降的含义是参数有微小的变化时输出会有什么变化，假设现在参数变化了而输出变成了1.61和2.41，但这经过四舍五入之后也就还是那个索引，没有变化无法带来梯度</strong>。</p>
<h5 id="改进">改进</h5>
<p><strong>舍弃四舍五入的做法！</strong>，采用如下的办法：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjdFlteHZaeTVqYzJSdWFXMW5MbU51THpKbE9ESTVOR1l5T0dFMk1EUmhOamc0TnpneU0ySXlZekZrWmpKaFl6QTFMbkJ1WnlOd2FXTmZZMlZ1ZEdWeQ==" alt="在这里插入图片描述" loading="lazy"></p>
<p><strong>根据输出与周围坐标的差距来进行加权和，这样在输出有微小变化的时候最终结果也有微小变化，这样就可以进行梯度下降了</strong>。</p>

</div>


            </div>
            
        </div>
	    
	    
    </div>
<!--end: topics 文章、评论容器-->
 
                    
                <div style="margin-top: 10px;">
                  </div> 
        </section>
	 
        <footer class="post-footer">
            <section class="author">
                                <p>分类：</p> 
                                <a class="cateclass" href="/default/index/cates?cid=161&cname=%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0" title="机器学习">机器学习</a>
                                                                <p>技术点：</p>
                                            </section>
        </footer>
        <p class="mt10">相关文章：</p>
        <div style="width: 100%;" class="contentcard">
      
            <div style="width: 100%;height: auto;" class="carditem litem clearfix"> 
                    <ul style="padding-left: 0rem;" class="cardcont">
                                            </ul>
               </div>   
         </div>
    </article>

  
</div>

<div class="rigthbox contentcard mt10">
 
          <div style="height: auto;" class="carditem litem">
    <div class="cardtit">猜你喜欢 </div>
        <ul class="cardcont">
                        </ul>
   </div> 

<div style="height: auto;" class="carditem litem">
    <div class="cardtit">相关资源 </div>
        <ul class="cardcont">
              
                            </ul>
   </div>
   
    <div style="height: auto;" class="carditem litem">
     <div class="cardtit">相似解决方案 </div>
         <ul class="cardcont">
                          </ul>
    </div>
  
   <div style="height: auto;background-color: #ddd;text-align: center;" class="carditem litem">
    <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
</div> 
   <div  style="height: auto;" class="carditem litem mt20">
    <div class="cardtit">热门标签  </div>
    <div class="tagbox">
                    <a target="_blank" title="Java" href="/default/index/tags?cid=164&cname=Java" >Java</a>
                        <a target="_blank" title="Python" href="/default/index/tags?cid=367&cname=Python" >Python</a>
                        <a target="_blank" title="linux" href="/default/index/tags?cid=274&cname=linux" >linux</a>
                        <a target="_blank" title="javascript" href="/default/index/tags?cid=169&cname=javascript" >javascript</a>
                        <a target="_blank" title="Mysql" href="/default/index/tags?cid=237&cname=Mysql" >Mysql</a>
                        <a target="_blank" title="C#" href="/default/index/tags?cid=187&cname=C%23" >C#</a>
                        <a target="_blank" title="Docker" href="/default/index/tags?cid=243&cname=Docker" >Docker</a>
                        <a target="_blank" title="算法" href="/default/index/tags?cid=344&cname=%E7%AE%97%E6%B3%95" >算法</a>
                        <a target="_blank" title="前端" href="/default/index/tags?cid=160&cname=%E5%89%8D%E7%AB%AF" >前端</a>
                        <a target="_blank" title="SpringBoot" href="/default/index/tags?cid=168&cname=SpringBoot" >SpringBoot</a>
                        <a target="_blank" title="Redis" href="/default/index/tags?cid=227&cname=Redis" >Redis</a>
                        <a target="_blank" title="Vue" href="/default/index/tags?cid=236&cname=Vue" >Vue</a>
                        <a target="_blank" title="spring" href="/default/index/tags?cid=696&cname=spring" >spring</a>
                        <a target="_blank" title="设计模式" href="/default/index/tags?cid=632&cname=%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F" >设计模式</a>
                        <a target="_blank" title=".net core" href="/default/index/tags?cid=381&cname=.net+core" >.net core</a>
                        <a target="_blank" title=".net" href="/default/index/tags?cid=300&cname=.net" >.net</a>
                        <a target="_blank" title="kubernetes" href="/default/index/tags?cid=2179&cname=kubernetes" >kubernetes</a>
                        <a target="_blank" title="c++" href="/default/index/tags?cid=312&cname=c%2B%2B" >c++</a>
                        <a target="_blank" title="数据库" href="/default/index/tags?cid=284&cname=%E6%95%B0%E6%8D%AE%E5%BA%93" >数据库</a>
                        <a target="_blank" title="数据结构" href="/default/index/tags?cid=247&cname=%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84" >数据结构</a>
                        <a target="_blank" title="大数据" href="/default/index/tags?cid=888&cname=%E5%A4%A7%E6%95%B0%E6%8D%AE" >大数据</a>
                        <a target="_blank" title="js" href="/default/index/tags?cid=159&cname=js" >js</a>
                        <a target="_blank" title="机器学习" href="/default/index/tags?cid=171&cname=%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0" >机器学习</a>
                        <a target="_blank" title="微服务" href="/default/index/tags?cid=832&cname=%E5%BE%AE%E6%9C%8D%E5%8A%A1" >微服务</a>
                        <a target="_blank" title="Android" href="/default/index/tags?cid=282&cname=Android" >Android</a>
                        <a target="_blank" title="Go" href="/default/index/tags?cid=839&cname=Go" >Go</a>
                        <a target="_blank" title="程序员" href="/default/index/tags?cid=327&cname=%E7%A8%8B%E5%BA%8F%E5%91%98" >程序员</a>
                        <a target="_blank" title="面试" href="/default/index/tags?cid=637&cname=%E9%9D%A2%E8%AF%95" >面试</a>
                        <a target="_blank" title="JVM" href="/default/index/tags?cid=727&cname=JVM" >JVM</a>
                        <a target="_blank" title="ASP.net core" href="/default/index/tags?cid=179&cname=ASP.net+core" >ASP.net core</a>
                        <a target="_blank" title="云原生" href="/default/index/tags?cid=22056&cname=%E4%BA%91%E5%8E%9F%E7%94%9F" >云原生</a>
                        <a target="_blank" title="人工智能" href="/default/index/tags?cid=270&cname=%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD" >人工智能</a>
                        <a target="_blank" title="后端" href="/default/index/tags?cid=1089&cname=%E5%90%8E%E7%AB%AF" >后端</a>
                        <a target="_blank" title="PHP" href="/default/index/tags?cid=281&cname=PHP" >PHP</a>
                        <a target="_blank" title="git" href="/default/index/tags?cid=226&cname=git" >git</a>
                        <a target="_blank" title="CSS" href="/default/index/tags?cid=817&cname=CSS" >CSS</a>
                        <a target="_blank" title="golang" href="/default/index/tags?cid=409&cname=golang" >golang</a>
                        <a target="_blank" title="k8s" href="/default/index/tags?cid=5067&cname=k8s" >k8s</a>
                        <a target="_blank" title="Nginx" href="/default/index/tags?cid=373&cname=Nginx" >Nginx</a>
                        <a target="_blank" title="Django" href="/default/index/tags?cid=634&cname=Django" >Django</a>
                        <a target="_blank" title="mybatis" href="/default/index/tags?cid=720&cname=mybatis" >mybatis</a>
                        <a target="_blank" title="深度学习" href="/default/index/tags?cid=345&cname=%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0" >深度学习</a>
                        <a target="_blank" title="多线程" href="/default/index/tags?cid=986&cname=%E5%A4%9A%E7%BA%BF%E7%A8%8B" >多线程</a>
                        <a target="_blank" title="React" href="/default/index/tags?cid=560&cname=React" >React</a>
                        <a target="_blank" title="架构" href="/default/index/tags?cid=2070&cname=%E6%9E%B6%E6%9E%84" >架构</a>
                        <a target="_blank" title="devops" href="/default/index/tags?cid=2662&cname=devops" >devops</a>
                        <a target="_blank" title="爬虫" href="/default/index/tags?cid=905&cname=%E7%88%AC%E8%99%AB" >爬虫</a>
                        <a target="_blank" title="云计算" href="/default/index/tags?cid=361&cname=%E4%BA%91%E8%AE%A1%E7%AE%97" >云计算</a>
                        <a target="_blank" title="Spring Boot" href="/default/index/tags?cid=201&cname=Spring+Boot" >Spring Boot</a>
                        <a target="_blank" title="LeetCode" href="/default/index/tags?cid=342&cname=LeetCode" >LeetCode</a>
                </div>
       
   </div>
   
        <div id="rightadbox" style="height: 300px;background-color: #ddd;text-align: center;" class="carditem litem">
            <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
        </div> 
</div>
<div class="clearfix"></div>
</main>
    
<div class="yllinks alink"></div>
 

<footer class="site-footer clearfix">
<section class="copyright">By &copy; 2026 <a href="/" title="www.likecs.com">likecs</a> 版权所有,<br/>本站所有数据收集于网络如有侵犯到您的权益请联系 进行下架处理1。 </section>
<section class="poweredby">  <a target="_blank" href="https://beian.miit.gov.cn/">粤ICP备22038628号</a>Powered By  WordPress </section>
<script charset="UTF-8" id="LA_COLLECT" src="//sdk.51.la/js-sdk-pro.min.js"></script>
<script>LA.init({id: "Je3PjbvUssp6BbvY",ck: "Je3PjbvUssp6BbvY"})</script>
<script>
var _hmt = _hmt || [];
(function() {
  var hm = document.createElement("script");
  hm.src = "https://hm.baidu.com/hm.js?2eb031e42d29b7c1a1f16948d2ae2a9f";
  var s = document.getElementsByTagName("script")[0]; 
  s.parentNode.insertBefore(hm, s);
})();
</script>
</footer>  
</div>
<script>
    $(function(){
                    $(".post-content").append('<p style="padding: 20px;color: #cacaca;">原文链接：https://www.cnblogs.com/FavoriteStar/p/16986271.html</p>')  
            }) 
</script> 
</body>
</html>