实际工作中,变量间未必都有线性关系,如服药后血药浓度与时间的关系;疾病疗效与疗程长短的关系;毒物剂量与致死率的关系等常呈曲线关系。曲线拟合(curve fitting)是指选择适当的曲线类型来拟合观测数据,并用拟合的曲线方程分析两变量间的关系。曲线拟合的方法很多,本节只介绍曲线直线化。
一、曲线直线化的意义
曲线直线化是曲线拟合的重要手段之一。对于某些非线性的资料可以通过简单的变量变换使之直线化,这样就可以按最小二乘法原理求出变换后变量的直线方程,在实际工作中常利用此直线方程绘制资料的标准工作曲线,同时根据需要可将此直线方程还原为曲线方程,实现对资料的曲线拟合。
二、常用的非线性函数
1.指数函数(exponential function)
Y=aebX(12.29)
对式(12.29)两边取对数,得
lnY=lna+bX(12.30)
b>0时,Y随X增大而增大;b<0时,Y随X增大而减少。见图12.4(a)、(b)。当以lnY和X绘制的散点图呈直线趋势时,可考虑采用指数函数来描述Y与X间的非线性关系,lna和b分别为截距和斜率。
更一般的指数函数
Y=aebX+k(12.31)
式中k为一常量,往往未知, 应用时可试用不同的值。
2.对数函数(lograrithmic function)
Y=a+blnX(X>0)(12.32)
b>0时,Y随X增大而增大,先快后慢;b<0时,Y随X增大而减少,先快后慢,见图12.4(c)、(d)。当以Y和lnX绘制的散点图呈直线趋势时,可考虑采用对数函数描述Y与X之间的非线性关系,式中的b和a分别为斜率和截距。
更一般的对数函数
Y=a+bln(X+k) (12.33)
式中k为一常量,往往未知。
YYYY
XXXX
(a)lnY=lna+bX(b)lnY=lna-bX(c)Y=a+blnX(d)Y=a-blnX
图12.4曲线示意
3.幂函数(power function)
Y=aXb(a>0,X>0)(12.34)
式中b>0时,Y随X增大而增大;b<0时,Y随X增大而减少。
对式(12.34)两边取对数,得
lnY=lna+blnX(12.35)
所以,当以lnY和lnX绘制的散点图呈直线趋势时,可考虑采用幂函数来描述Y和X间的非线性关系,lna和b分别是截距和斜率。
更一般的幂函数
Y=aXb+k(12.36)
式中k为一常量,往往未知。
三、利用线性回归拟合曲线的一般步骤
(一)绘制散点图,选择合适的曲线类型
一般根据资料性质结合专业知识便可确定资料的曲线类型,不能确定时,可在方格坐标纸上绘制散点图,根据散点的分布,选择接近的、合适的曲线类型。
(二)进行变量变换
Y’=f(Y),X’=g(X)(12.37)
使变换后的两个变量呈直线关系。
(三)按最小二乘法原理求线性方程和方差分析
(四)将直线化方程转换为关于原变量X、Y的函数表达式
[例10.8] 某研究室以已知浓度X的
免疫球蛋白A(IgA,)作火箭电泳,测得火箭高度Y(mm)如表12.2资料(1)、(2)列。试求Y关于X的非线性回归方程。
表10.2火箭电泳实验资料
|
IgA( X (1) |
火箭高度(mm) Y (2) |
(3) |
(4) |
|
0.2 |
7.6 |
-1.60944 |
7.22842 |
|
0.4 |
12.3 |
-0.91629 |
12.61907 |
|
0.6 |
15.7 |
-0.51083 |
15.77239 |
|
0.8 |
18.2 |
-0.22314 |
18.00972 |
|
1.0 |
18.7 |
0 |
19.74512 |
|
1.2 |
21.4 |
0.18232 |
21.16304 |
|
1.4 |
22.6 |
0.33647 |
22.36188 |
|
1.6 |
23.8 |
0.47000 |
23.40036 |
1.以资料(1)、(2)列数据在方格纸上作散点图,见图12.5,图形与图12.4(c)相近,故可尝试对数变换。
3.按最小二乘法原理求Y关于X’的线性方程,得
=19.75+7.78X’
通过对回归系数的假设检验表明该线性方程具有统计学意义。
4.求曲线方程将X’=lnX代入求得的直线方程,得