array(2) {
  ["docs"]=>
  array(10) {
    [0]=>
    array(10) {
      ["id"]=>
      string(3) "428"
      ["text"]=>
      string(77) "Visual Studio 2017 单独启动MSDN帮助（Microsoft Help Viewer）的方法"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(8) "DonetRen"
      ["tagsname"]=>
      string(55) "Visual Studio 2017|MSDN帮助|C#程序|.NET|Help Viewer"
      ["tagsid"]=>
      string(23) "[401,402,403,"300",404]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400964"
      ["_id"]=>
      string(3) "428"
    }
    [1]=>
    array(10) {
      ["id"]=>
      string(3) "427"
      ["text"]=>
      string(42) "npm -v；报错 cannot find module "wrapp""
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "zzty"
      ["tagsname"]=>
      string(50) "node.js|npm|cannot find module &quot;wrapp“|node"
      ["tagsid"]=>
      string(19) "[398,"239",399,400]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400760"
      ["_id"]=>
      string(3) "427"
    }
    [2]=>
    array(10) {
      ["id"]=>
      string(3) "426"
      ["text"]=>
      string(54) "说说css中pt、px、em、rem都扮演了什么角色"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(12) "zhengqiaoyin"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400640"
      ["_id"]=>
      string(3) "426"
    }
    [3]=>
    array(10) {
      ["id"]=>
      string(3) "425"
      ["text"]=>
      string(83) "深入学习JS执行--创建执行上下文（变量对象，作用域链，this）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "Ry-yuan"
      ["tagsname"]=>
      string(33) "Javascript|Javascript执行过程"
      ["tagsid"]=>
      string(13) "["169","191"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511399901"
      ["_id"]=>
      string(3) "425"
    }
    [4]=>
    array(10) {
      ["id"]=>
      string(3) "424"
      ["text"]=>
      string(30) "C# 排序技术研究与对比"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "vveiliang"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(8) ".Net Dev"
      ["catesid"]=>
      string(5) "[199]"
      ["createtime"]=>
      string(10) "1511399150"
      ["_id"]=>
      string(3) "424"
    }
    [5]=>
    array(10) {
      ["id"]=>
      string(3) "423"
      ["text"]=>
      string(72) "【算法】小白的算法笔记：快速排序算法的编码和优化"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "penghuwan"
      ["tagsname"]=>
      string(6) "算法"
      ["tagsid"]=>
      string(7) "["344"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511398109"
      ["_id"]=>
      string(3) "423"
    }
    [6]=>
    array(10) {
      ["id"]=>
      string(3) "422"
      ["text"]=>
      string(64) "JavaScript数据可视化编程学习（二）Flotr2，雷达图"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "chengxs"
      ["tagsname"]=>
      string(28) "数据可视化|前端学习"
      ["tagsid"]=>
      string(9) "[396,397]"
      ["catesname"]=>
      string(18) "前端基本知识"
      ["catesid"]=>
      string(5) "[198]"
      ["createtime"]=>
      string(10) "1511397800"
      ["_id"]=>
      string(3) "422"
    }
    [7]=>
    array(10) {
      ["id"]=>
      string(3) "421"
      ["text"]=>
      string(36) "C#表达式目录树（Expression）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "wwym"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(4) ".NET"
      ["catesid"]=>
      string(7) "["119"]"
      ["createtime"]=>
      string(10) "1511397474"
      ["_id"]=>
      string(3) "421"
    }
    [8]=>
    array(10) {
      ["id"]=>
      string(3) "420"
      ["text"]=>
      string(47) "数据结构 队列_队列实例：事件处理"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "idreamo"
      ["tagsname"]=>
      string(40) "C语言|数据结构|队列|事件处理"
      ["tagsid"]=>
      string(23) "["246","247","248",395]"
      ["catesname"]=>
      string(12) "数据结构"
      ["catesid"]=>
      string(7) "["133"]"
      ["createtime"]=>
      string(10) "1511397279"
      ["_id"]=>
      string(3) "420"
    }
    [9]=>
    array(10) {
      ["id"]=>
      string(3) "419"
      ["text"]=>
      string(47) "久等了,博客园官方Android客户端发布"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(3) "cmt"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511396549"
      ["_id"]=>
      string(3) "419"
    }
  }
  ["count"]=>
  int(200)
}
222<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="utf-8" />
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta http-equiv="content-language" content="zh-CN" />
<meta http-equiv="X-UA-Compatible" content="IE=edge" /> 
    <title>mnist手写数字识别——深度学习入门项目（tensorflow+keras+Sequential模型） - 爱码网</title>
     
<meta name="keywords" content="mnist手写数字识别——深度学习入门项目（tensorflow+keras+Sequential模型）" />
<meta name="description" content="目录ECharts异步加载ECharts数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。chart.setOption({    color: [" />
<meta name="viewport" content="width=device-width, initial-scale=1.0" />
<link rel="stylesheet" type="text/css" href="/statics/css/base.css?v=2.7" />
<script src="/statics/js/detail.min.js?v=2.2"></script>   
<script>
   $(document).ready(function () { 
		$("img").error(function () {
			$(this).hide();
		}); 
	}); 
</script>
</head>
<body class="home-template dtpg">
<nav class="main-nav clearfix">
    <div class="inner">
        <ul class="nav">
            <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/" title="爱码网">首页</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/1.html" title="前端技术">前端技术</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/9.html" title="编程语言">编程语言</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/31.html" title="人工智能">人工智能</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/41.html" title="运维知识">运维知识</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/52.html" title="资源下载">资源下载</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/68.html" title="常用小工具">常用小工具</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/72.html" title="技术问答">技术问答</a></li>
                    </ul>            
	 
    </div>
</nav><div class="site-wrapper">
 
    <header style="height: auto;padding: 10px 0px;" class="main-header">
        <div style="max-width:910px" class="main-header-content inner">
                        <h1 class="page-title"><a href="/show-976261.html" title="mnist手写数字识别——深度学习入门项目（tensorflow+keras+Sequential模型）">mnist手写数字识别——深度学习入门项目（tensorflow+keras+Sequential模型）</a></h1>
            
        </div>

    </header>
    <main class="content" role="main">
	

        <div class="leftbox">
    <article class="post tag-uifont tag-webview">
        <header class="post-header">
            <footer class="tc"> chenzhenhong 
                <time class="post-date" datetime="2021-12-19">2021-12-19</time>
            </footer>
        </header>
        <section class="post-content">
            <div class="contentbef">  
                  
                              </div>

            
<!--done-->
<div id="topics">
	<div class="post">
		
		
		<div class="postBody">
			<div id="likecs_post_body" class="blogpost-body blogpost-body-html">
<h2>
<span style="font-family: 宋体"><a name="l0" rel="noopener"></a></span><span style="font-family: 宋体">前言</span>
</h2>
<p><span style="font-family: 宋体; font-size: 16px">今天记录一下深度学习的另外一个入门项目——《mnist数据集手写数字识别》，这是一个入门必备的学习案例，主要使用了tensorflow下的keras网络结构的Sequential模型，常用层的Dense全连接层、Activation激活层和Reshape层。还有其他方法训练手写数字识别模型，可以基于pytorch实现的，<a href="/default/index/url?u=aHR0cHM6Ly93d3cuY25ibG9ncy5jb20vY2hlbnpoZW5ob25nL3AvMTMzNTUxOTQuaHRtbA%3D%3D" target="_blank" rel="noopener">《Pytorch实现基于卷积神经网络的面部表情识别(详细步骤)》</a> 这篇就是基于pytorch实现，pytorch里也封装了mnist的数据集，实现方法应该类似，正在学习中……</span><br><span style="font-family: 宋体; font-size: 16px">这一篇记录则是基于keras的Sequential模型实现的。</span></p>
<div class="toc">
<h3><strong><span style="font-family: 宋体; font-size: 18px">项目步骤</span></strong></h3>
<p><span style="font-family: 宋体; font-size: 18px">   <a href="#l0" rel="nofollow" target="_blank">前言</a></span></p>
<p><strong><span style="font-family: 宋体; font-size: 18px">　　 <a href="#l1" rel="nofollow" target="_blank">1、mnist手写数字真面目</a></span></strong></p>
<p><strong><span style="font-family: 宋体; font-size: 18px">　　　　<a href="#l1-1" rel="nofollow" target="_blank">1.1、mnist（集成）数据集</a></span></strong></p>
<p><span style="font-size: 18px">　　　　<a href="#l1-2" rel="nofollow" target="_blank">1.2、mnist数据集（训练测试数据与标签分离）</a></span></p>
<p><span style="font-size: 18px">　　 <a href="#l2" rel="nofollow" target="_blank">2、Sequential模型训练</a></span></p>
<p><span style="font-size: 18px">　　 <a href="#l3" rel="nofollow" target="_blank">写在后面</a></span></p>

</div>
<p><span style="font-family: 宋体"> </span></p>
<h2><span style="font-family: 宋体"><a name="l1" rel="noopener"></a>1、mnist手写数字真面目</span></h2>
<p><span style="font-family: 宋体; font-size: 16px">我们使用离线下载的数据集进行导入，一定程度上解决了从远程加载数据缓慢的问题，这里有两种数据集提供给大家，分别是：</span></p>
<ol>
<li>
<strong><span style="font-family: 宋体; font-size: 16px">mnist.npz数据集</span></strong><br><span style="font-family: 宋体; font-size: 16px">它是把手写数字的图像数据和对应标签集成在一起，而且训练集与测试集也在里面，使用的时候无需拆分文件，只需要简单代码划分数据，可直接下载本地 <a href="https://download.csdn.net/download/Charzous/12680529" target="_blank" rel="nofollow">mnist手写数字识别数据集npz文件.zip</a></span>
</li>
<li>
<strong><span style="font-family: 宋体; font-size: 16px">mnist.zip数据集</span></strong><br><span style="font-family: 宋体; font-size: 16px">它包含了两个压缩包，分别是训练集和测试集（文件名：mnist_traint_data.zip和mnist_test_data.zip），每个数据集解压后里面分别是数据和对应的标签，所以最后由4个文件，可直接下载本地 <a href="https://download.csdn.net/download/Charzous/12681042" target="_blank" rel="nofollow">mnist训练数据+测试数据(手写数字识别).zip</a></span>
</li>


</ol>
<h3><span style="font-family: 宋体">　　<a name="l1-1" rel="noopener"></a><strong><span style="font-size: 16px">1.1、mnist.npz（集成）数据集</span></strong></span></h3>
<p><span style="font-family: 宋体; font-size: 16px">下载好<a href="https://download.csdn.net/download/Charzous/12680529" target="_blank" rel="nofollow">mnist手写数字识别数据集npz文件.zip</a>之后，解压得到mnist.npz之后，我们这里开始写代码看看手写数字图像的真面目。</span><br><span style="font-family: 宋体; font-size: 16px">显示图像代码：</span></p>
<div class="likecs_code">
<pre><span style="font-family: 宋体"><span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> numpy as np
</span><span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> matplotlib.pyplot as plt


</span><span style="color: rgba(0, 0, 255, 1)">def</span> load_mnist(): <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 自定义加载数据</span>
    path = r<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">D:\mnist_data\mnist.npz</span><span style="color: rgba(128, 0, 0, 1)">\'</span>  <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 放置mnist.npz的目录。注意斜杠</span>
    f =<span style="color: rgba(0, 0, 0, 1)"> np.load(path)
    x_train, y_train </span>= f[<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">x_train</span><span style="color: rgba(128, 0, 0, 1)">\'</span>], f[<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">y_train</span><span style="color: rgba(128, 0, 0, 1)">\'</span>]  <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 代码实现分离数据集里面的训练集和测试集以及对应标签</span>
    x_test, y_test = f[<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">x_test</span><span style="color: rgba(128, 0, 0, 1)">\'</span>], f[<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">y_test</span><span style="color: rgba(128, 0, 0, 1)">\'</span>]  <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> x_train为训练数据，y_train为对应标签</span>
<span style="color: rgba(0, 0, 0, 1)">
    f.close() </span><span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 关闭文件</span>
    <span style="color: rgba(0, 0, 255, 1)">return</span><span style="color: rgba(0, 0, 0, 1)"> (x_train, y_train), (x_test, y_test)


</span><span style="color: rgba(0, 0, 255, 1)">def</span><span style="color: rgba(0, 0, 0, 1)"> main():
    (X_train, y_train_label), (test_image, test_label) </span>= load_mnist() <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)">后续可以显示训练数据的数字或者测试数据的</span>
<span style="color: rgba(0, 0, 0, 1)">
    fig, ax </span>= plt.subplots(nrows=5, ncols=5, sharex=True, sharey=True)  <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 显示图像</span>
    ax =<span style="color: rgba(0, 0, 0, 1)"> ax.flatten()
    </span><span style="color: rgba(0, 0, 255, 1)">for</span> i <span style="color: rgba(0, 0, 255, 1)">in</span> range(25<span style="color: rgba(0, 0, 0, 1)">):
        img </span>= X_train[i].reshape(28, 28<span style="color: rgba(0, 0, 0, 1)">)
        </span><span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> img = X_train[y_train_label == 8][i].reshape(28, 28)  # 显示标签为8的数字图像</span>
<span style="color: rgba(0, 0, 0, 1)">        ax[i].set_title(y_train_label[i])
        ax[i].imshow(img, cmap</span>=<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">Greys</span><span style="color: rgba(128, 0, 0, 1)">\'</span>, interpolation=<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">nearest</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">)
    ax[0].set_xticks([])
    ax[0].set_yticks([])
    plt.tight_layout()
    plt.show()

</span><span style="color: rgba(0, 0, 255, 1)">if</span> <span style="color: rgba(128, 0, 128, 1)">__name__</span> == <span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">__main__</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">:
    main()</span></span></pre>
</div>
<p><span style="font-family: 宋体; font-size: 16px">效果如下：</span><br><span style="font-family: 宋体; font-size: 16px"><img src="/default/index/img?u=aHR0cHM6Ly9pbWctYmxvZy5jc2RuaW1nLmNuLzIwMjAwODAyMjIxMTAxNDk5LnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3dhdGVybWFyayx0eXBlX1ptRnVaM3BvWlc1bmFHVnBkR2ssc2hhZG93XzEwLHRleHRfYUhSMGNITTZMeTlpYkc5bkxtTnpaRzR1Ym1WMEwwTm9ZWEo2YjNWeixzaXplXzE2LGNvbG9yX0ZGRkZGRix0Xzcw" alt="图1"></span><br><span style="font-family: 宋体; font-size: 16px">也可以花样输出：</span><br><span style="font-family: 宋体; font-size: 16px">代码：</span></p>
<div class="likecs_code">
<pre><span style="font-family: 宋体"><span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> numpy as np
</span><span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> matplotlib.pyplot as plt


</span><span style="color: rgba(0, 0, 255, 1)">def</span><span style="color: rgba(0, 0, 0, 1)"> load_mnist():
    path </span>= r<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">D:\mnist_data\mnist.npz</span><span style="color: rgba(128, 0, 0, 1)">\'</span>  <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 放置mnist.npz的目录。注意斜杠</span>
    f =<span style="color: rgba(0, 0, 0, 1)"> np.load(path)
    x_train, y_train </span>= f[<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">x_train</span><span style="color: rgba(128, 0, 0, 1)">\'</span>], f[<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">y_train</span><span style="color: rgba(128, 0, 0, 1)">\'</span>]  <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 代码实现分离数据集里面的训练集和测试集以及对应标签</span>
    x_test, y_test = f[<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">x_test</span><span style="color: rgba(128, 0, 0, 1)">\'</span>], f[<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">y_test</span><span style="color: rgba(128, 0, 0, 1)">\'</span>]  <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> x_train为训练数据，y_train为对应标签</span>
<span style="color: rgba(0, 0, 0, 1)">
    f.close() </span><span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 关闭文件</span>
    <span style="color: rgba(0, 0, 255, 1)">return</span><span style="color: rgba(0, 0, 0, 1)"> (x_train, y_train), (x_test, y_test)


</span><span style="color: rgba(0, 0, 255, 1)">def</span><span style="color: rgba(0, 0, 0, 1)"> main():
    (X_train, y_train_label), (test_image, test_label) </span>=<span style="color: rgba(0, 0, 0, 1)"> load_mnist()
    plt.subplot(</span>221)<span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)">显示图像</span>
    plt.imshow(X_train[0], cmap=plt.get_cmap(<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">Accent</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">))
    plt.subplot(</span>222<span style="color: rgba(0, 0, 0, 1)">)
    plt.imshow(X_train[</span>1], cmap=plt.get_cmap(<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">gray</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">))
    plt.subplot(</span>223<span style="color: rgba(0, 0, 0, 1)">)
    plt.imshow(X_train[</span>2], cmap=plt.get_cmap(<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">Blues</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">))
    plt.subplot(</span>224<span style="color: rgba(0, 0, 0, 1)">)
    plt.imshow(X_train[</span>3], cmap=plt.get_cmap(<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">Oranges</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">))
    plt.show()


</span><span style="color: rgba(0, 0, 255, 1)">if</span> <span style="color: rgba(128, 0, 128, 1)">__name__</span> == <span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">__main__</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">:
    main()</span></span></pre>
</div>
<p><span style="font-family: 宋体; font-size: 16px">图像显示：</span><br><span style="font-family: 宋体; font-size: 16px"><img src="/default/index/img?u=aHR0cHM6Ly9pbWctYmxvZy5jc2RuaW1nLmNuLzIwMjAwODAyMjIxMjMyOTE2LnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3dhdGVybWFyayx0eXBlX1ptRnVaM3BvWlc1bmFHVnBkR2ssc2hhZG93XzEwLHRleHRfYUhSMGNITTZMeTlpYkc5bkxtTnpaRzR1Ym1WMEwwTm9ZWEo2YjNWeixzaXplXzE2LGNvbG9yX0ZGRkZGRix0Xzcw" alt="图2"></span></p>
<h3><span style="font-family: 宋体; font-size: 16px">　　<strong><span style="font-size: 18px"><a name="l1-2" rel="noopener"></a>1.2、mnist数据集（训练测试数据与标签分离）</span></strong></span></h3>
<p><span style="font-family: 宋体; font-size: 16px">这里介绍第二中方法，也就是数据集是分离的，下载好<a href="https://download.csdn.net/download/Charzous/12681042" target="_blank" rel="nofollow">mnist训练数据+测试数据(手写数字识别).zip</a>之后，解压得到文件如图：</span><br><span style="font-family: 宋体; font-size: 16px"><img src="/default/index/img?u=aHR0cHM6Ly9pbWctYmxvZy5jc2RuaW1nLmNuLzIwMjAwODAyMjIxNTI1Mzg0LnBuZw%3D%3D" alt="图3"></span><br><span style="font-family: 宋体; font-size: 16px">进去解压得到：</span><br><span style="font-family: 宋体; font-size: 16px"><img src="/default/index/img?u=aHR0cHM6Ly9pbWctYmxvZy5jc2RuaW1nLmNuLzIwMjAwODAyMjIxNjM1NDUucG5n" alt="文件"></span><br><span style="font-family: 宋体; font-size: 16px">可以看到分别是训练集和测试集，包括数据和标签。</span><br><span style="font-family: 宋体; font-size: 16px">这种方法比较麻烦，没想到吧！^_ ^ ，大家可以选择第一种步骤简单</span><br><span style="font-family: 宋体; font-size: 16px">最后得到：</span><br><span style="font-family: 宋体; font-size: 16px"><img src="/default/index/img?u=aHR0cHM6Ly9pbWctYmxvZy5jc2RuaW1nLmNuLzIwMjAwODAyMjIyNDA1Mjc4LnBuZw%3D%3D" alt="在这里插入图片描述"></span><br><span style="font-family: 宋体; font-size: 16px">导入时候需要用到的是这些.gz文件。</span><br><span style="font-family: 宋体; font-size: 16px">显示图像代码：</span></p>
<div class="likecs_code">
<pre><span style="font-family: 宋体"><span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> gzip
</span><span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> os
</span><span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> numpy as np
</span><span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> matplotlib.pyplot as plt

local_file </span>= <span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">D:\mnist_data</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">
files </span>= [<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">train-images-idx3-ubyte.gz</span><span style="color: rgba(128, 0, 0, 1)">\'</span>, <span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">train-labels-idx1-ubyte.gz</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">,
         </span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">t10k-images-idx3-ubyte.gz</span><span style="color: rgba(128, 0, 0, 1)">\'</span>, <span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">t10k-labels-idx1-ubyte.gz</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">]


</span><span style="color: rgba(0, 0, 255, 1)">def</span> load_local_mnist(filename):<span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 加载文件</span>
    paths =<span style="color: rgba(0, 0, 0, 1)"> []
    file_read </span>=<span style="color: rgba(0, 0, 0, 1)"> []
    </span><span style="color: rgba(0, 0, 255, 1)">for</span> file <span style="color: rgba(0, 0, 255, 1)">in</span><span style="color: rgba(0, 0, 0, 1)"> files:
        paths.append(os.path.join(filename, file))
    </span><span style="color: rgba(0, 0, 255, 1)">for</span> path <span style="color: rgba(0, 0, 255, 1)">in</span><span style="color: rgba(0, 0, 0, 1)"> paths:
        file_read.append(gzip.open(path, </span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">rb</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">))
    </span><span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> print(file_read)</span>
<span style="color: rgba(0, 0, 0, 1)">
    train_labels </span>= np.frombuffer(file_read[1].read(), np.uint8, offset=8)<span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)">文件读取以及格式转换</span>
    train_images = np.frombuffer(file_read[0].read(), np.uint8, offset=16<span style="color: rgba(0, 0, 0, 1)">) \
        .reshape(len(train_labels), </span>28, 28<span style="color: rgba(0, 0, 0, 1)">)
    test_labels </span>= np.frombuffer(file_read[3].read(), np.uint8, offset=8<span style="color: rgba(0, 0, 0, 1)">)
    test_images </span>= np.frombuffer(file_read[2].read(), np.uint8, offset=16<span style="color: rgba(0, 0, 0, 1)">) \
        .reshape(len(test_labels), </span>28, 28<span style="color: rgba(0, 0, 0, 1)">)
    </span><span style="color: rgba(0, 0, 255, 1)">return</span><span style="color: rgba(0, 0, 0, 1)"> (train_images, train_labels), (test_images, test_labels)


</span><span style="color: rgba(0, 0, 255, 1)">def</span><span style="color: rgba(0, 0, 0, 1)"> main():
    (x_train, y_train), (x_test, y_test) </span>=<span style="color: rgba(0, 0, 0, 1)"> load_local_mnist(local_file)

    fig, ax </span>= plt.subplots(nrows=6, ncols=6, sharex=True, sharey=True)<span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)">显示图像</span>
    ax =<span style="color: rgba(0, 0, 0, 1)"> ax.flatten()
    </span><span style="color: rgba(0, 0, 255, 1)">for</span> i <span style="color: rgba(0, 0, 255, 1)">in</span> range(36<span style="color: rgba(0, 0, 0, 1)">):
        img</span>=x_test[i].reshape(28,28<span style="color: rgba(0, 0, 0, 1)">)
        </span><span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> img = x_train[y_train == 8][i].reshape(28, 28)  # 显示标签为8的数字图像</span>
<span style="color: rgba(0, 0, 0, 1)">        ax[i].set_title(y_train[i])
        ax[i].imshow(img, cmap</span>=<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">Greys</span><span style="color: rgba(128, 0, 0, 1)">\'</span>, interpolation=<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">nearest</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">)
    ax[0].set_xticks([])
    ax[0].set_yticks([])
    plt.tight_layout()
    plt.show()


</span><span style="color: rgba(0, 0, 255, 1)">if</span> <span style="color: rgba(128, 0, 128, 1)">__name__</span> == <span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">__main__</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">:
    main()</span></span></pre>
</div>
<p><span style="font-family: 宋体; font-size: 16px">输出结果：</span><br><span style="font-family: 宋体"><img src="/default/index/img?u=aHR0cHM6Ly9pbWctYmxvZy5jc2RuaW1nLmNuLzIwMjAwODAyMjIyNzM5Nzk1LnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3dhdGVybWFyayx0eXBlX1ptRnVaM3BvWlc1bmFHVnBkR2ssc2hhZG93XzEwLHRleHRfYUhSMGNITTZMeTlpYkc5bkxtTnpaRzR1Ym1WMEwwTm9ZWEo2YjNWeixzaXplXzE2LGNvbG9yX0ZGRkZGRix0Xzcw" alt="结果1"></span></p>
<h2><span style="font-family: 宋体"><a name="l2" rel="noopener"></a>2、Sequential模型训练</span></h2>
<p><span style="font-family: 宋体; font-size: 16px">这里实现主要使用了tensorflow下的keras网络结构的Sequential模型，常用层的Dense全连接层、Activation激活层和Reshape层。tensorflow安装有问题可参考<a href="https://blog.csdn.net/Charzous/article/details/106879374" rel="nofollow" target="_blank">《</a><a class="postTitle2 vertical-middle" href="/default/index/url?u=aHR0cHM6Ly93d3cuY25ibG9ncy5jb20vY2hlbnpoZW5ob25nL3AvMTIzMjI0NjYuaHRtbA%3D%3D" target="_blank" rel="noopener">初入机器学习，安装tensorflow包等问题总结</a><a href="https://blog.csdn.net/Charzous/article/details/106879374" rel="nofollow" target="_blank">》</a></span><br><span style="font-family: 宋体; font-size: 16px">模型比较简单，网络搭建以及模型选择的损失函数、优化器可见代码。</span></p>
<div class="likecs_code">
<pre><span style="font-family: 宋体"><span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> numpy as np
</span><span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> os
</span><span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> gzip
</span><span style="color: rgba(0, 0, 255, 1)">from</span> tensorflow <span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> keras
</span><span style="color: rgba(0, 0, 255, 1)">from</span> tensorflow.keras.optimizers <span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> SGD
</span><span style="color: rgba(0, 0, 255, 1)">from</span> tensorflow_core.python.keras.utils <span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> np_utils
</span><span style="color: rgba(0, 0, 255, 1)">from</span> tensorflow.keras.layers <span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> Dense, Dropout, Activation

local_file </span>= <span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">D:\mnist_data</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">
files </span>= [<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">train-images-idx3-ubyte.gz</span><span style="color: rgba(128, 0, 0, 1)">\'</span>, <span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">train-labels-idx1-ubyte.gz</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">,
         </span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">t10k-images-idx3-ubyte.gz</span><span style="color: rgba(128, 0, 0, 1)">\'</span>, <span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">t10k-labels-idx1-ubyte.gz</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">]

</span><span style="color: rgba(0, 0, 255, 1)">def</span> load_local_mnist(filename):  <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 加载文件</span>
    paths =<span style="color: rgba(0, 0, 0, 1)"> []
    file_read </span>=<span style="color: rgba(0, 0, 0, 1)"> []
    </span><span style="color: rgba(0, 0, 255, 1)">for</span> file <span style="color: rgba(0, 0, 255, 1)">in</span><span style="color: rgba(0, 0, 0, 1)"> files:
        paths.append(os.path.join(filename, file))
    </span><span style="color: rgba(0, 0, 255, 1)">for</span> path <span style="color: rgba(0, 0, 255, 1)">in</span><span style="color: rgba(0, 0, 0, 1)"> paths:
        file_read.append(gzip.open(path, </span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">rb</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">))
    </span><span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> print(file_read)</span>
<span style="color: rgba(0, 0, 0, 1)">
    train_labels </span>= np.frombuffer(file_read[1].read(), np.uint8, offset=8)  <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 文件读取以及格式转换</span>
    train_images = np.frombuffer(file_read[0].read(), np.uint8, offset=16<span style="color: rgba(0, 0, 0, 1)">) \
        .reshape(len(train_labels), </span>28, 28<span style="color: rgba(0, 0, 0, 1)">)
    test_labels </span>= np.frombuffer(file_read[3].read(), np.uint8, offset=8<span style="color: rgba(0, 0, 0, 1)">)
    test_images </span>= np.frombuffer(file_read[2].read(), np.uint8, offset=16<span style="color: rgba(0, 0, 0, 1)">) \
        .reshape(len(test_labels), </span>28, 28<span style="color: rgba(0, 0, 0, 1)">)
    </span><span style="color: rgba(0, 0, 255, 1)">return</span><span style="color: rgba(0, 0, 0, 1)"> (train_images, train_labels), (test_images, test_labels)


</span><span style="color: rgba(0, 0, 255, 1)">def</span> load_data():<span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 加载模型需要的数据</span>
    (x_train, y_train), (x_test, y_test) =<span style="color: rgba(0, 0, 0, 1)"> load_local_mnist(local_file)
    number </span>= 10000<span style="color: rgba(0, 0, 0, 1)">
    x_train </span>=<span style="color: rgba(0, 0, 0, 1)"> x_train[0:number]
    y_train </span>=<span style="color: rgba(0, 0, 0, 1)"> y_train[0:number]
    x_train </span>= x_train.reshape(number, 28 * 28<span style="color: rgba(0, 0, 0, 1)">)
    x_test </span>= x_test.reshape(x_test.shape[0], 28 * 28<span style="color: rgba(0, 0, 0, 1)">)
    x_train </span>= x_train.astype(<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">float32</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">)
    x_test </span>= x_test.astype(<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">float32</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">)

    y_train </span>= np_utils.to_categorical(y_train, 10<span style="color: rgba(0, 0, 0, 1)">)
    y_test </span>= np_utils.to_categorical(y_test, 10<span style="color: rgba(0, 0, 0, 1)">)
    x_train </span>=<span style="color: rgba(0, 0, 0, 1)"> x_train
    x_test </span>=<span style="color: rgba(0, 0, 0, 1)"> x_test

    x_train </span>= x_train / 255<span style="color: rgba(0, 0, 0, 1)">
    x_test </span>= x_test / 255
    <span style="color: rgba(0, 0, 255, 1)">return</span><span style="color: rgba(0, 0, 0, 1)"> (x_train, y_train), (x_test, y_test)


(X_train, Y_train), (X_test, Y_test) </span>=<span style="color: rgba(0, 0, 0, 1)"> load_data()
model </span>= keras.Sequential()<span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 模型选择</span>
model.add(Dense(input_dim=28 * 28, units=690<span style="color: rgba(0, 0, 0, 1)">,
                activation</span>=<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">relu</span><span style="color: rgba(128, 0, 0, 1)">\'</span>))  <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> tanh  activation：Sigmoid、tanh、ReLU、LeakyReLU、pReLU、ELU、maxout</span>
model.add(Dense(units=690, activation=<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">relu</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">))
model.add(Dense(units</span>=690, activation=<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">relu</span><span style="color: rgba(128, 0, 0, 1)">\'</span>))  <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> tanh</span>
model.add(Dense(units=10, activation=<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">relu</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">))
model.compile(loss</span>=<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">mse</span><span style="color: rgba(128, 0, 0, 1)">\'</span>, optimizer=SGD(lr=0.1<span style="color: rgba(0, 0, 0, 1)">),
              metrics</span>=[<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">accuracy</span><span style="color: rgba(128, 0, 0, 1)">\'</span>])  <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> loss:mse,categorical_crossentropy,optimizer: rmsprop 或 adagrad、SGD（此处推荐）</span>
model.fit(X_train, Y_train, batch_size=100, epochs=20<span style="color: rgba(0, 0, 0, 1)">)
result </span>=<span style="color: rgba(0, 0, 0, 1)"> model.evaluate(X_test, Y_test)
</span><span style="color: rgba(0, 0, 255, 1)">print</span>(<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">TEST ACC:</span><span style="color: rgba(128, 0, 0, 1)">\'</span>, result[1])</span></pre>
</div>
<p><span style="font-family: 宋体; font-size: 16px">经过稍微调优，发现输入层激活函数使用relu和tanh效果好，其他网络层使用relu。另外，损失函数使用了<span style="color: rgba(255, 0, 0, 1)">MSE（均方误差）</span>，优化器使用 <span style="color: rgba(255, 0, 0, 1)">SGD（随即梯度下降）</span>，学习率<span style="color: rgba(255, 0, 0, 1)">learning rate调到0.1</span>，度量常用正确率。</span><br><span style="font-family: 宋体; font-size: 16px">参数<span style="color: rgba(255, 0, 0, 1)">batch_size=100, epochs=20</span>，增加参数更新以及训练速度。</span><br><span style="font-family: 宋体; font-size: 16px">以上参数以及选择训练效果如下：</span><br><span style="font-family: 宋体"><img src="/default/index/img?u=aHR0cHM6Ly9pbWctYmxvZy5jc2RuaW1nLmNuLzIwMjAwODAyMjI0MDE0MTg2LmpwZz94LW9zcy1wcm9jZXNzPWltYWdlL3dhdGVybWFyayx0eXBlX1ptRnVaM3BvWlc1bmFHVnBkR2ssc2hhZG93XzEwLHRleHRfYUhSMGNITTZMeTlpYkc5bkxtTnpaRzR1Ym1WMEwwTm9ZWEo2YjNWeixzaXplXzE2LGNvbG9yX0ZGRkZGRix0XzcwI3BpY19jZW50ZXI%3D" alt="结果1"></span><br><span style="font-family: 宋体; font-size: 16px">使用优化器为adagrad效果：</span><br><span style="font-family: 宋体"><img src="/default/index/img?u=aHR0cHM6Ly9pbWctYmxvZy5jc2RuaW1nLmNuLzIwMjAwODAyMjI0MDU2NDQzLmpwZz94LW9zcy1wcm9jZXNzPWltYWdlL3dhdGVybWFyayx0eXBlX1ptRnVaM3BvWlc1bmFHVnBkR2ssc2hhZG93XzEwLHRleHRfYUhSMGNITTZMeTlpYkc5bkxtTnpaRzR1Ym1WMEwwTm9ZWEo2YjNWeixzaXplXzE2LGNvbG9yX0ZGRkZGRix0XzcwI3BpY19jZW50ZXI%3D" alt="结果2"></span><br><span style="font-family: 宋体; font-size: 16px">大家也可以自行各种尝试，优化器和损失函数选择，参数调优等，进一步提高正确率。</span></p>
<p><span style="font-family: 宋体; font-size: 16px">这里提供另一种写法，模型构建类似。</span></p>
<div class="likecs_code">
<pre><span style="font-family: 宋体"><span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> tensorflow as tf
</span><span style="color: rgba(0, 0, 255, 1)">from</span> tensorflow.keras <span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> datasets, layers, optimizers, models, metrics
</span><span style="color: rgba(0, 0, 255, 1)">from</span> tensorflow.keras.optimizers <span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> SGD

</span><span style="color: rgba(0, 0, 255, 1)">import</span><span style="color: rgba(0, 0, 0, 1)"> os

os.environ[</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">TF_CPP_MIN_LOG_LEVEL</span><span style="color: rgba(128, 0, 0, 1)">\'</span>] = <span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">2</span><span style="color: rgba(128, 0, 0, 1)">\'</span>  <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 忽略tensorflow版本警告</span>
(xs, ys), _ =<span style="color: rgba(0, 0, 0, 1)"> datasets.mnist.load_data()
</span><span style="color: rgba(0, 0, 255, 1)">print</span>(<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">datasets:</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">, xs.shape, ys.shape, xs.min(), xs.max())

</span><span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> tf.compat.v1.enable_eager_execution()</span>
<span style="color: rgba(0, 0, 0, 1)">tf.enable_eager_execution()
xs </span>= tf.convert_to_tensor(xs, dtype=tf.float32) / 255<span style="color: rgba(0, 0, 0, 1)">.
db </span>=<span style="color: rgba(0, 0, 0, 1)"> tf.data.Dataset.from_tensor_slices((xs, ys))
db </span>= db.batch(100).repeat(20<span style="color: rgba(0, 0, 0, 1)">)

network </span>= models.Sequential([layers.Dense(256, activation=<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">relu</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">),
                             layers.Dense(</span>256, activation=<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">relu</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">),
                             layers.Dense(</span>256, activation=<span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">relu</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">),
                             layers.Dense(</span>10<span style="color: rgba(0, 0, 0, 1)">)])
network.build(input_shape</span>=(None, 28 * 28<span style="color: rgba(0, 0, 0, 1)">))
network.summary()

optimizer </span>= optimizers.SGD(lr=0.01<span style="color: rgba(0, 0, 0, 1)">)
acc_meter </span>= metrics.Accuracy()<span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 度量正确率</span>

<span style="color: rgba(0, 0, 255, 1)">for</span> step, (x, y) <span style="color: rgba(0, 0, 255, 1)">in</span><span style="color: rgba(0, 0, 0, 1)"> enumerate(db):

    with tf.GradientTape() as tape:
        </span><span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> [b, 28, 28] =&gt; [b, 784] 784维=24*24</span>
        x = tf.reshape(x, (-1, 28 * 28))<span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)">-1的含义，数组新的shape属性应该要与原来的配套，根据剩下的维度计算出数组的另外一个shape属性值。</span>
        <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> [b, 784] =&gt; [b, 10]</span>
        out =<span style="color: rgba(0, 0, 0, 1)"> network(x)
        </span><span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> [b] =&gt; [b, 10]</span>
        y_onehot = tf.one_hot(y, depth=10)  <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 独热编码，y = 0 对应的输出是[1,0,0,0,0,0,0,0,0,0]，范围0-9，depth深度10层表示10个数字</span>
        <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> [b, 10]</span>
        loss = tf.square(out - y_onehot)<span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 计算模型预测与实际的损失</span>
        <span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> [b]</span>
        loss = tf.reduce_sum(loss) / 32<span style="color: rgba(0, 0, 0, 1)">

    acc_meter.update_state(tf.argmax(out, axis</span>=1<span style="color: rgba(0, 0, 0, 1)">), y)
    grads </span>= tape.gradient(loss, network.trainable_variables)<span style="color: rgba(0, 128, 0, 1)">#</span><span style="color: rgba(0, 128, 0, 1)"> 计算梯度</span>
<span style="color: rgba(0, 0, 0, 1)">    optimizer.apply_gradients(zip(grads, network.trainable_variables))

    </span><span style="color: rgba(0, 0, 255, 1)">if</span> step % 200 ==<span style="color: rgba(0, 0, 0, 1)"> 0:
        </span><span style="color: rgba(0, 0, 255, 1)">print</span>(step, <span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">loss:</span><span style="color: rgba(128, 0, 0, 1)">\'</span>, float(loss), <span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(128, 0, 0, 1)">acc:</span><span style="color: rgba(128, 0, 0, 1)">\'</span><span style="color: rgba(0, 0, 0, 1)">, acc_meter.result().numpy())
        acc_meter.reset_states()</span></span></pre>
</div>
<p><span style="font-family: 宋体; font-size: 16px">最后正确率比上面好一点，如图：</span><br><span style="font-family: 宋体"><img src="/default/index/img?u=aHR0cHM6Ly9pbWctYmxvZy5jc2RuaW1nLmNuLzIwMjAwODAyMjMyMTI3ODkyLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3dhdGVybWFyayx0eXBlX1ptRnVaM3BvWlc1bmFHVnBkR2ssc2hhZG93XzEwLHRleHRfYUhSMGNITTZMeTlpYkc5bkxtTnpaRzR1Ym1WMEwwTm9ZWEo2YjNWeixzaXplXzE2LGNvbG9yX0ZGRkZGRix0Xzcw" alt="图3"></span></p>
<h2><span style="font-family: 宋体"><a name="l3" rel="noopener"></a>写在后面</span></h2>
<p><span style="font-family: 宋体; font-size: 18px">经过这次学习，感觉收获了许多，之前只是在理论知识上的理解，现在配合代码实践，模型训练，理解更加深刻，还存在不足，欢迎大家指正交流，这个过程的详细步骤，希望能帮助跟我一样入门需要的伙伴，记录学习过程，感觉总结一下很好，继续加油！</span></p>
<p><span style="font-family: 宋体; font-size: 18px">我的CSDN博客：<a href="https://blog.csdn.net/Charzous/article/details/107748508" target="_blank" rel="nofollow">mnist手写数字识别深度学习入门项目（tensorflow+keras+Sequential模型）</a></span><br><span style="font-family: 宋体; font-size: 18px">我的博客园：<a href="/default/index/url?u=aHR0cHM6Ly93d3cuY25ibG9ncy5jb20vY2hlbnpoZW5ob25nL3AvMTM0MjQ0NjIuaHRtbA%3D%3D" target="_blank" rel="noopener">mnist手写数字识别——深度学习入门项目（tensorflow+keras+Sequential模型）</a></span></p>
<div class="creativecommons">版权声明：本文为博主原创文章，遵循<a href="http://creativecommons.org/licenses/by-sa/4.0/" rel="nofollow" target="_blank"> CC 4.0 BY-SA </a>版权协议，转载请附上原文出处链接和本声明。</div>
<div class="article-source-link">本文链接：<a href="https://blog.csdn.net/Charzous/article/details/107748508" rel="nofollow" target="_blank">https://blog.csdn.net/Charzous/article/details/107748508</a>
</div>
</div>


		</div>
		
	</div>
	
	
</div>
<!--end: topics 文章、评论容器-->


<a id="!comments"></a>
<div id="blog-comments-placeholder"></div>
<div id="comment_form" class="commentform">
    <a name="commentform"></a>
    <div id="divCommentShow"></div>
    
    <div id="comment_form_container"></div>
    <div class="ad_text_commentbox" id="ad_text_under_commentbox"></div>
    <div id="likecs_ch"></div>
    <div id="opt_under_post"></div>
    <div id="likecs_c1" class="under-post-card">
            <div id="div-gpt-ad-1592365906576-0" style="width: 300px; height: 250px;"></div>
    </div>
    <div id="under_post_card1"></div>
    <div id="under_post_card2"></div>
    <div id="HistoryToday" class="under-post-card"></div>
    
</div>

 
                <div style="margin-top: 10px;">
                  </div> 
        </section>
	 
        <footer class="post-footer">
            <section class="author">
                                <p>分类：</p> 
                                                                <p>技术点：</p>
                                            </section>
        </footer>
        <p class="mt10">相关文章：</p>
        <div style="width: 100%;" class="contentcard">
      
            <div style="width: 100%;height: auto;" class="carditem litem clearfix"> 
                    <ul style="padding-left: 0rem;" class="cardcont">
                                            </ul>
               </div>   
         </div>
    </article>

  
</div>

<div class="rigthbox contentcard mt10">
 
          <div style="height: auto;" class="carditem litem">
    <div class="cardtit">猜你喜欢 </div>
        <ul class="cardcont">
                        </ul>
   </div> 

<div style="height: auto;" class="carditem litem">
    <div class="cardtit">相关资源 </div>
        <ul class="cardcont">
              
                            </ul>
   </div>
   
    <div style="height: auto;" class="carditem litem">
     <div class="cardtit">相似解决方案 </div>
         <ul class="cardcont">
                          </ul>
    </div>
  
   <div style="height: auto;background-color: #ddd;text-align: center;" class="carditem litem">
    <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
</div> 
   <div  style="height: auto;" class="carditem litem mt20">
    <div class="cardtit">热门标签  </div>
    <div class="tagbox">
                    <a target="_blank" title="Java" href="/default/index/tags?cid=164&cname=Java" >Java</a>
                        <a target="_blank" title="Python" href="/default/index/tags?cid=367&cname=Python" >Python</a>
                        <a target="_blank" title="linux" href="/default/index/tags?cid=274&cname=linux" >linux</a>
                        <a target="_blank" title="javascript" href="/default/index/tags?cid=169&cname=javascript" >javascript</a>
                        <a target="_blank" title="Mysql" href="/default/index/tags?cid=237&cname=Mysql" >Mysql</a>
                        <a target="_blank" title="C#" href="/default/index/tags?cid=187&cname=C%23" >C#</a>
                        <a target="_blank" title="Docker" href="/default/index/tags?cid=243&cname=Docker" >Docker</a>
                        <a target="_blank" title="算法" href="/default/index/tags?cid=344&cname=%E7%AE%97%E6%B3%95" >算法</a>
                        <a target="_blank" title="前端" href="/default/index/tags?cid=160&cname=%E5%89%8D%E7%AB%AF" >前端</a>
                        <a target="_blank" title="SpringBoot" href="/default/index/tags?cid=168&cname=SpringBoot" >SpringBoot</a>
                        <a target="_blank" title="Redis" href="/default/index/tags?cid=227&cname=Redis" >Redis</a>
                        <a target="_blank" title="Vue" href="/default/index/tags?cid=236&cname=Vue" >Vue</a>
                        <a target="_blank" title="spring" href="/default/index/tags?cid=696&cname=spring" >spring</a>
                        <a target="_blank" title="设计模式" href="/default/index/tags?cid=632&cname=%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F" >设计模式</a>
                        <a target="_blank" title=".net core" href="/default/index/tags?cid=381&cname=.net+core" >.net core</a>
                        <a target="_blank" title=".net" href="/default/index/tags?cid=300&cname=.net" >.net</a>
                        <a target="_blank" title="kubernetes" href="/default/index/tags?cid=2179&cname=kubernetes" >kubernetes</a>
                        <a target="_blank" title="c++" href="/default/index/tags?cid=312&cname=c%2B%2B" >c++</a>
                        <a target="_blank" title="数据库" href="/default/index/tags?cid=284&cname=%E6%95%B0%E6%8D%AE%E5%BA%93" >数据库</a>
                        <a target="_blank" title="数据结构" href="/default/index/tags?cid=247&cname=%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84" >数据结构</a>
                        <a target="_blank" title="大数据" href="/default/index/tags?cid=888&cname=%E5%A4%A7%E6%95%B0%E6%8D%AE" >大数据</a>
                        <a target="_blank" title="js" href="/default/index/tags?cid=159&cname=js" >js</a>
                        <a target="_blank" title="机器学习" href="/default/index/tags?cid=171&cname=%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0" >机器学习</a>
                        <a target="_blank" title="微服务" href="/default/index/tags?cid=832&cname=%E5%BE%AE%E6%9C%8D%E5%8A%A1" >微服务</a>
                        <a target="_blank" title="Android" href="/default/index/tags?cid=282&cname=Android" >Android</a>
                        <a target="_blank" title="Go" href="/default/index/tags?cid=839&cname=Go" >Go</a>
                        <a target="_blank" title="程序员" href="/default/index/tags?cid=327&cname=%E7%A8%8B%E5%BA%8F%E5%91%98" >程序员</a>
                        <a target="_blank" title="面试" href="/default/index/tags?cid=637&cname=%E9%9D%A2%E8%AF%95" >面试</a>
                        <a target="_blank" title="JVM" href="/default/index/tags?cid=727&cname=JVM" >JVM</a>
                        <a target="_blank" title="ASP.net core" href="/default/index/tags?cid=179&cname=ASP.net+core" >ASP.net core</a>
                        <a target="_blank" title="云原生" href="/default/index/tags?cid=22056&cname=%E4%BA%91%E5%8E%9F%E7%94%9F" >云原生</a>
                        <a target="_blank" title="人工智能" href="/default/index/tags?cid=270&cname=%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD" >人工智能</a>
                        <a target="_blank" title="后端" href="/default/index/tags?cid=1089&cname=%E5%90%8E%E7%AB%AF" >后端</a>
                        <a target="_blank" title="PHP" href="/default/index/tags?cid=281&cname=PHP" >PHP</a>
                        <a target="_blank" title="git" href="/default/index/tags?cid=226&cname=git" >git</a>
                        <a target="_blank" title="CSS" href="/default/index/tags?cid=817&cname=CSS" >CSS</a>
                        <a target="_blank" title="golang" href="/default/index/tags?cid=409&cname=golang" >golang</a>
                        <a target="_blank" title="k8s" href="/default/index/tags?cid=5067&cname=k8s" >k8s</a>
                        <a target="_blank" title="Nginx" href="/default/index/tags?cid=373&cname=Nginx" >Nginx</a>
                        <a target="_blank" title="Django" href="/default/index/tags?cid=634&cname=Django" >Django</a>
                        <a target="_blank" title="mybatis" href="/default/index/tags?cid=720&cname=mybatis" >mybatis</a>
                        <a target="_blank" title="深度学习" href="/default/index/tags?cid=345&cname=%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0" >深度学习</a>
                        <a target="_blank" title="多线程" href="/default/index/tags?cid=986&cname=%E5%A4%9A%E7%BA%BF%E7%A8%8B" >多线程</a>
                        <a target="_blank" title="React" href="/default/index/tags?cid=560&cname=React" >React</a>
                        <a target="_blank" title="架构" href="/default/index/tags?cid=2070&cname=%E6%9E%B6%E6%9E%84" >架构</a>
                        <a target="_blank" title="devops" href="/default/index/tags?cid=2662&cname=devops" >devops</a>
                        <a target="_blank" title="爬虫" href="/default/index/tags?cid=905&cname=%E7%88%AC%E8%99%AB" >爬虫</a>
                        <a target="_blank" title="云计算" href="/default/index/tags?cid=361&cname=%E4%BA%91%E8%AE%A1%E7%AE%97" >云计算</a>
                        <a target="_blank" title="Spring Boot" href="/default/index/tags?cid=201&cname=Spring+Boot" >Spring Boot</a>
                        <a target="_blank" title="LeetCode" href="/default/index/tags?cid=342&cname=LeetCode" >LeetCode</a>
                </div>
       
   </div>
   
        <div id="rightadbox" style="height: 300px;background-color: #ddd;text-align: center;" class="carditem litem">
            <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
        </div> 
</div>
<div class="clearfix"></div>
</main>
    
<div class="yllinks alink"></div>
 

<footer class="site-footer clearfix">
<section class="copyright">By &copy; 2026 <a href="/" title="www.likecs.com">likecs</a> 版权所有,<br/>本站所有数据收集于网络如有侵犯到您的权益请联系 进行下架处理1。 </section>
<section class="poweredby">  <a target="_blank" href="https://beian.miit.gov.cn/">粤ICP备22038628号</a>Powered By  WordPress </section>
<script charset="UTF-8" id="LA_COLLECT" src="//sdk.51.la/js-sdk-pro.min.js"></script>
<script>LA.init({id: "Je3PjbvUssp6BbvY",ck: "Je3PjbvUssp6BbvY"})</script>
<script>
var _hmt = _hmt || [];
(function() {
  var hm = document.createElement("script");
  hm.src = "https://hm.baidu.com/hm.js?2eb031e42d29b7c1a1f16948d2ae2a9f";
  var s = document.getElementsByTagName("script")[0]; 
  s.parentNode.insertBefore(hm, s);
})();
</script>
</footer>  
</div>
<script>
    $(function(){
                    $(".post-content").append('<p style="padding: 20px;color: #cacaca;">原文链接：https://www.cnblogs.com/chenzhenhong/p/13424462.html</p>')  
            }) 
</script> 
</body>
</html>