学习大数据分布式计算时多少会涉及到机器学习的算法,所以理解一些机器学习基础,有助于理解大数据分布式计算系统(比如spark)的设计。机器学习中一个常见的就是gradient descent算法,是线性回归问题的一个基础算法。gradient是数学概念。
Gradient
如果一个函数有n个自变量:值是添加还是减小,下同。
gradient所反映的正负相关性非常重要,是理解gradient descent算法的一个关键)的合集。
Partial Derivative
partial derivative是derivative的一个延伸概念,是一个有n维变量的函数的变化的敏感程度(以及正负相关性)。
Derivative
一个一维变量的函数的变化的敏感程度(以及正负相关性)。
.
Gradient Descent算法
线性回归问题能够归结为求一个函数有最小值。
如果把这个求解问题交给你,你能求出来吗?非常难把,
而gradient descent算法则能解决问题。
……待续