import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
from tensorflow.contrib.tensorboard.plugins import projector #导入一个projector的包
#载入数据集
mnist=input_data.read_data_sets('mnist_data',one_hot=True)#one_hot把像素点都转变成0或1的形式
#运行次数
max_steps=2001
#图片数量
image_num=3000
#文件路径
DIR='d:/pycharm/mycode/mnist/'
#定义会话
sess=tf.Session()
#载入图片
embedding=tf.Variable(tf.stack(mnist.test.images[:image_num]),trainable=False,name='embedding')
#打包的是手写数字test里面的图片0-image_num,然后存在embedding
'''
stack函数:把各个数组打包
x is [1,4]
y is [2,5]
z is [3,6]
stack([x,y,z]) ==> [[1,4],[2,5],[3,6]] axis默认为0,即横向打包
stack([x,y,z],axis=1) ==>[[1,2,3],[4,5,6]] axis为1时,即纵向打包
'''
#参数概要
def variable_summaries(var):
with tf.name_scope('summaries'):
mean=tf.reduce_mean(var)#计算平均值
tf.summary.scalar('mean',mean)#记录平均值,将其命名为mean。summary.scalar用来显示标量信息
with tf.name_scope('stddev'):
stddev=tf.sqrt(tf.reduce_mean(tf.square(var-mean)))
tf.summary.scalar('stddev',stddev)# 标准差
tf.summary.scalar('max',tf.reduce_max(var))#最大值
tf.summary.scalar('min',tf.reduce_min(var))#最小值
tf.summary.histogram('histogram',var)#直方图
#命名空间
with tf.name_scope('input'): #命名随意,比如input,下面的x和y要缩进,表示x,y放在input空间
#定义两个placeholder,配合上面命名空间,给x,y取个名字
x=tf.placeholder(tf.float32,[None,784],name='x-input')#建立一个占位符,None是图片数,784是每幅图的像素个数
y=tf.placeholder(tf.float32,[None,10],name='y-input')# 标签,建立一个占位符,10是指0-9十个数
#显示图片
with tf.name_scope('input_reshape'):#命名空间
image_shaped_input=tf.reshape(x,[-1,28,28,1])#把训练或测试的图片显示出来,把x转变成[-1,28,28,1]。-1代表不确定,即上面[None,784]中的None,784转变成[28,28].1代表维度是1,表示黑白,如果是彩色,则是3
tf.summary.image('input',image_shaped_input,10)#用summary.image把image_shaped_input存到input里面,一共放10张图片
with tf.name_scope('layer1'):
#创建一个简单的神经网络,输入层784个神经元,输出层10个神经元,不设隐藏层
with tf.name_scope('wights1'):
W=tf.Variable(tf.zeros([784,1000]),name='W')#权值,设一个变量,置0
variable_summaries(W)#把权值W当作参数,计算的各种指标
with tf.name_scope('biases1'):
b=tf.Variable(tf.zeros([1000]),name='b')#偏置值
variable_summaries(b)#把偏置值b当作参数,计算的各种指标
with tf.name_scope('wx_plus_b1'):
wx_plus_b=tf.nn.tanh(tf.matmul(x,W)+b)
with tf.name_scope('layer2'):
with tf.name_scope('wights2'):
W2=tf.Variable(tf.truncated_normal([1000,1000],stddev=0.1))
with tf.name_scope('biases2'):
b2=tf.Variable(tf.zeros([1000])+0.1)
with tf.name_scope('wx_plus_b2'):
L2=tf.nn.tanh(tf.matmul(wx_plus_b,W2)+b2)
with tf.name_scope('layer3'):
with tf.name_scope('wights3'):
W3=tf.Variable(tf.truncated_normal([1000,500],stddev=0.1))
with tf.name_scope('biases3'):
b3=tf.Variable(tf.zeros([500])+0.1)
with tf.name_scope('wx_plus_b3'):
L3=tf.nn.tanh(tf.matmul(L2,W3)+b3)
with tf.name_scope('layer4'):
with tf.name_scope('wights4'):
W4=tf.Variable(tf.truncated_normal([500,10],stddev=0.1))
with tf.name_scope('biases4'):
b4=tf.Variable(tf.zeros([10])+0.1)
with tf.name_scope('softmax'):
prediction=tf.nn.softmax(tf.matmul(L3,W4)+b4)#信号总和,经过softmax函数(**函数)转化成概率值
#使用交叉熵代价函数
with tf.name_scope('loss'):
loss=tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y,logits=prediction))
tf.summary.scalar('loss',loss)
#使用梯度下降法
with tf.name_scope('train'):
train_step=tf.train.GradientDescentOptimizer(0.2).minimize(loss)
#初始化变量
init=tf.global_variables_initializer()
with tf.name_scope('accuracy'):
with tf.name_scope('correct_prediction'):
#训练好后求准确率,结果存放在一个布尔型列表中,argmax返回一维张量中最大的值所在的位置
correct_prediction=tf.equal(tf.argmax(y,1),tf.argmax(prediction,1))#argmax函数是对行或列计算最大值,1表示按行,0表示按列,找到最大概率标签的位置。 equal函数是比较两个参数大小,相等的话返回True,不相等返回False
with tf.name_scope('accuracy'):
#求准确率
accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))#cast()是类型转换函数,把布尔型参数转换为32位古典型,然后求平均值。true变成1.0,flse变成0
#Boolean→数值型:True转换为-1,False转换为0。数值型→Boolean:0转换为False,其他转换为True
tf.summary.scalar('accuracy',accuracy)
#产生metadata文件,其实就是test图片对应的label值
#if tf.gfile.Exists('./projector/metadata.tsv'):
#tf.gfile.DeleteRecursively('./projector/metadata.tsv')#j检测是否已有该文件,有的话就将其删除
with open('./projector/metadata.tsv','w') as f:#生成该文件,并以写的方式打开
labels=sess.run(tf.argmax(mnist.test.labels[:],1))#得到test里面的label,argmax找到最大值位置,即label如果是0的话,则数据格式是1000000000;如果是1的话,数据格式是0100000000
for i in range(image_num):
f.write(str(labels[i])+'\n')#把image_num个图片对应的label写入metadata.tsv文件中
#合并所有的summary,并将其加入到sess.run的语句里
merged=tf.summary.merge_all()
#下面这段是为了生成三维立体动态图像模型,embedding,以及上面各参数的显示
projector_writer=tf.summary.FileWriter(DIR+'projector/projector',sess.graph)#前面是路径,graph存在该文件夹中,从而可以使用tensorboard查看
saver=tf.train.Saver()#保存这个网络的模型
config=projector.ProjectorConfig()#定义一个配置项
embed=config.embeddings.add()
embed.tensor_name=embedding.name#前面embedding变量的名字赋予tensor_name
embed.metadata_path=DIR+'projector/metadata.tsv'#把metadata.tsv传给embed.metadata_path
embed.sprite.image_path=DIR+'projector/data/mnist_10k_sprite.png'#把单张1万个手写数字图片传给embed程序
embed.sprite.single_image_dim.extend([28,28])#把上面图片切分成每个数字块,即[28,28]的小块
projector.visualize_embeddings(projector_writer,config)#显示三维图
#训练
with tf.Session() as sess:
sess.run(init)#初始化变量
for i in range (max_steps):#一次训练100张图片,总共训练了100*max_step张图片,此方法不去在乎总的数据集迭代了多少次
#每个批次100个样本
batch_xs,batch_ys=mnist.train.next_batch(100)
run_options=tf.RunOptions(trace_level=tf.RunOptions.FULL_TRACE)#固定写法
run_metadata=tf.RunMetadata()#固定写法
summary,_=sess.run([merged,train_step],feed_dict={x:batch_xs,y:batch_ys},options=run_options,run_metadata=run_metadata)#每tain训练一次,统计一次参数merged,运行后得到的merged存在summary里。后面两参数固定写法
projector_writer.add_run_metadata(run_metadata,'step%03d'%i)#把run_metadata写入tensorboard文件
projector_writer.add_summary(summary,i)#将summary和运行周期i写入tensorboard文件
if i%100==0:#每训练100次,打印一次准确率
acc=sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels})
print('Iter'+str(i)+',Testing Accuracy='+str(acc))
saver.save(sess,DIR+'projector/projector/a_model.ckpt',global_step=max_steps)#训练完了,将训练好的模型保存在此路径
projector_writer.close()
sess.close()
结果:
Iter0,Testing Accuracy=0.1888
Iter100,Testing Accuracy=0.8203
Iter200,Testing Accuracy=0.8386
Iter300,Testing Accuracy=0.8485
Iter400,Testing Accuracy=0.9034
Iter500,Testing Accuracy=0.9411
Iter600,Testing Accuracy=0.9501
Iter700,Testing Accuracy=0.9482
Iter800,Testing Accuracy=0.9507
Iter900,Testing Accuracy=0.9568
Iter1000,Testing Accuracy=0.9582
Iter1100,Testing Accuracy=0.9582
Iter1200,Testing Accuracy=0.9611
Iter1300,Testing Accuracy=0.9554
Iter1400,Testing Accuracy=0.9645
Iter1500,Testing Accuracy=0.9652
Iter1600,Testing Accuracy=0.967
Iter1700,Testing Accuracy=0.9687
Iter1800,Testing Accuracy=0.9679
Iter1900,Testing Accuracy=0.9702
Iter2000,Testing Accuracy=0.9685