Part 1 分类
Lecture 1 机器学习基础
目录
机器学习再述
机器学习的真正含义是彰显数据背后的真实意义(简单来说,就是把无序的数据转换成有用的信息)
用到了很多统计学的知识
移动计算和传感器产生的海量数据,非常有用
一切物质的属性(数据)称之为特征
机器学习的主要任务是:分类、回归(有监督的学习)
无监督的学习(聚类)
机器学习开发的步骤
1 收集数据(制作网络爬虫从网站上抽取数据、公开数据集)
2 准备输入数据(数据格式,如python list)
3 分析输入数据(人工、自动:确保没有垃圾数据)
4 训练算法
5 测试算法(评估)
6 使用算法(转换为应用程序,执行实际任务)
python
处理和操作文本文件非常简单
访问web页面的函数库,从HTML提取数据
科学函数库SciPy、NumPy使用底层语言(C和Fortran)编写,提高计算性能、运行效率
所有人在小学三年级就已经学会了写作,然而大多数人必须从事其他更重要的工作
编写代码如同写作,是完成其他任务的工具
NumPy
numpy函数库存在两种不同的数据类型:矩阵matrix、数据array
使用mat()函数可以将数组转换为矩阵:
机器学习是数据驱动产业必备的基本技能