注,本文是在学习吴恩达老师(Andrew Ng)网易公开课课程的的学习总结和理解,希望与君共勉!
二分分类问题:假如有一副下图中含有两只小猫的图片,人和机器分别怎么判断图片中是否有猫存在?
在二分分类中的问题中,我们的目标是训练出一个分类器(classifier)它以特征向量x作为输入预测出结果y是0还是1,也就是预测出图片中是否含有猫。
1. 在我们自然人看来,一眼便能看出图片中存在两只猫,因为我们人类本身就是一个高级的智能系统。
2. 可是对于计算机来说,他可能没有那么智能,计算机能处理的只是数据,所以我们要用办法把含有猫的图片转化成计算机能够处理的数据。
对于图片,计算机可以用表示亮度值的64X64的Red,green,blue三个矩阵来存储,把矩阵值放到一起组成一个非常长的特征向量x(feature vector)。向量的维度(dimension)是64X64X3=12288,用n或者nx表示。所以特征向量X表示这个图片。
3.一些符号的定义
3.1 (x,y)表示单独的样本,x取值为nx或者n维特征向量,y取值为0或者1。
3.2 training set是由m个training example组成。用符号m=m_train 表示有m个training example,用m_test 表示有m个test example。
3.3 如果把x(1),x(2)...x(m) 按照列的形式(注意不是按照x转置后用行的形式)组织在一起就形成一个n*m维的矩阵用X表示。
用python,X.shape = (nx,m),同时将y(1),y(2)...y(m)按照列的形式放到一起组成1*m维矩阵用Y表示。用python,Y.shap = (1,m)