第八章 回分析
第节 Linear程
811 功
812 实例操作
第二节 Curve Estimation程
821 功
822 实例操作
第三节 Logistic程
831 功
832 实例操作
第四节 Probit程
841 功
842 实例操作
第五节 Nonlinear程
851 功
852 实例操作
回分析处理两两变量间线性存关系统计方法医学领域中类问题普遍头发中某种金属元素含量血液中该元素含量关系体表面积身高体重关系等等回分析说明种存变化数学关系
第节 Linear程
811 功
调程完成二元元线性回分析元线性回分析中户根需选筛选变量方法(:逐步法前法法等)
返回目录 返回全书目录
812 实例操作
[例81]某医师测10名3岁童身高(cm)体重(kg)体表面积(cm2)资料试元回方法确定身高体重变量体表面积应变量回方程
童编号
体表面积(Y)
身高(X1)
体重(X2)
1
2
3
4
5
6
7
8
9
10
5382
5299
5358
5292
5602
6014
5830
6102
6075
6411
880
876
885
890
877
895
888
904
906
912
110
118
120
123
131
137
144
149
152
160
8121 数准备
激活数理窗口定义变量名:体表面积Y保留3位数身高体重分X1X21位数输入原始数结果图81示
图81 原始数输入
8122 统计分析
激活Statistics菜单选Regression中Linear项弹出Linear Regression话框(图82示)话框左侧变量列表中选y点击Ø钮进入Dependent框选x1x2点击Ø钮进入Indepentdent(s)框Method处拉菜单5选项:Enter(全部入选法)Stepwise(逐步法)Remove(强制剔法)Backward(法)Forward(前法)例选Enter法点击OK钮完成分析
图82 线性回分析话框
户点击Statistics钮选择否作变量描述性统计回方程应变量信区间估计等分析点击Plots钮选择否作变量分布图(例求标准化Y预测值作变量分布图)点击Save钮选择回分析关结果否作保存(例求根确定回方程求未校正Y预测值标准化Y预测值作保存)点击Options钮选择变量入选剔αβ值缺失值处理方法
8123 结果解释
结果输出窗口中统计数:
* * * * M U L T I P L E R E G R E S S I O N * * * *
Listwise Deletion of Missing Data
Equation Number 1 Dependent Variable Y
Block Number 1 Method Enter X1 X2
Variable(s) Entered on Step Number
1 X2
2 X1
Multiple R 94964
R Square 90181
Adjusted R Square 87376
Standard Error 14335
Analysis of Variance
DF Sum of Squares Mean Square
Regression 2 132104 66052
Residual 7 14384 02055
F 3214499 Signif F 0003
Variables in the Equation
Variable B SE B Beta T Sig T
X1 068701 074768 215256 919 3887
X2 183756 056816 757660 3234 0144
(Constant) 2856476 6017776 475 6495
End Block Number 1 All requested variables entered
结果显示例X1X2变量Y应变量采全部入选法建立回方程回方程复相关系数094964决定系数(r2)090181方差分析F3414499P00003回方程效回方程Y00687101X1+0183756X22856476
例求建立回方程计算Y预测值标准化Y预测值(谓标准化Y预测值指根回方程求
Y预测值转化成均数0标准差1标准正态分布Y值)计算结果保存入原数库系统原始X1X2值代入方程求Y值预测值(库中pre_1栏)标准化Y预测值(库中zpr_1栏)详见图83
图83 计算结果保存
例求标准化Y预测值作变量分布图系统绘制统计图送Chart Carousel窗口双击该窗口见图显示结果
图84 标准化Y预测值作正态分布图
返回目录 返回全书目录
第二节 Curve Estimation程
821 功
调程完成列关曲线拟合功:
1Linear:拟合直线方程(实际Linear程二元直线回相Y b0+ b1X)
2Quadratic:拟合二次方程(Y b0+ b1X+b2X2)
3Compound:拟合复合曲线模型(Y b0×b1X)
4Growth:拟合等级数曲线模型(Y e(b0+b1X))
5Logarithmic:拟合数方程(Y b0+b1lnX)
6Cubic:拟合三次方程(Y b0+ b1X+b2X2+b3X3)
7S:拟合S形曲线(Y e(b0+b1X))
8Exponential:拟合指数方程(Y b0 eb1X)
9Inverse:数Y b0+b1X进行变换
10Power:拟合幂曲线模型(Y b0X b1)
11Logistic:拟合Logistic曲线模型(Y 1(1u + b0×b1X)
返回目录 返回全书目录
822 实例操作
[例82]某1963年调查童年龄(岁)X锡克试验阴性率()Y资料试拟合数曲线
年龄(岁)
X
锡克试验阴性率()
Y
1
2
3
4
5
6
7
571
760
909
930
967
956
962
8221 数准备
激活数理窗口定义变量名:锡克试验阴性率Y年龄X输入原始数
8222 统计分析
激活Statistics菜单选Regression中Curve Estimation项弹出Curve Estimation话框(图85示)话框左侧变量列表中选y点击Ø钮进入Dependent框选x点击Ø钮进入Indepentdent(s)框Model框选择需曲线模型例选择Logarithmic模型(数曲线)选Plot models项求绘制曲线拟合图点击Save钮弹出Curve EstimationSave话框选择Predicted value项求原始数库中保存根数方程求出Y预测值点击Continue钮返回Curve Estimation话框点击OK钮
图85 曲线拟合话框
8223 结果解释
结果输出窗口中统计数:
ndependent X
Dependent Mth Rsq df F Sigf b0 b1
Y LOG 913 5 5232 001 613259 206704
X变量Y应变量采数曲线拟合方法建立方程决定系数R20913(接1)作拟合优度检验方差分析表明:F5232P0001拟合度数方程:Y613259+206704lnX
例求绘制曲线拟合图结果图86示
图86 数曲线拟合情形
根方程Y613259+206704lnX原始数X值代入求Y预测值(变量名fit_1)存入数库中参见图87
图87 计算结果保存
返回目录 返回全书目录
第三节 Logistic程
831 功
调程完成Logistic回运算谓Logistic回指应变量二级计分二类评定回分析医学研究中常遇:死亡否(生死二类评定)概率病身生理状况患疾病严重程度关某种疾病易感性概率(患病患病二类评定)体性年龄免疫水等关类问题解决均助逻辑回完成
特指出节介绍Logistic程应日常说Logistic曲线模型(S倒S形曲线)相区户果拟合Logistic曲线模型调章第二节Curve Estimation程系统提供11种曲线模型中含Logistic曲线模型(参见节)
般元回中P(概率)应变量方程Pb0+b1X1+b2X2+…+bkXk
该方程计算时常会出现P>1P<0合理情形P作数单位转换
logitPln(P1P)Logistic回方程:
eb0+b1X1+b2X2+…+bkXk
P ———————————
1+ eb0+b1X1+b2X2+…+bkXk
返回目录 返回全书目录
832 实例操作
[例83]某医师研究男性胃癌患者发生术院感染影响素资料表请通Logistic回统计方法影响素进行分析
术感染
()
Y
年龄
(岁)
X1
手术创伤程度
(5等级)
X2
营养状态
(3等级)
X3
术前预防性抗菌
()
X4
白细胞数
(×109L)
X5
癌肿病理分度
(TNM分总)
X6
69
72
57
41
32
65
58
54
55
59
64
36
42
48
50
4
5
3
1
1
3
3
4
2
1
2
1
3
4
1
2
3
2
1
1
3
2
2
2
1
2
1
1
2
2
56
44
97
112
104
70
31
66
79
60
91
84
53
46
128
9
6
4
5
5
5
6
6
7
4
6
8
6
5
4
8321 数准备
激活数理窗口定义变量名:术感染Y(字符变量输入Y输入N)年龄X1手术创伤程度X2营养状态X3术前预防性抗菌X4(字符变量输入Y输入N)白细胞数X5癌肿病理分度X6求输入原始数
8322 统计分析
激活Statistics菜单选Regression中Logistic项弹出Logistic Regression话框(图88示)话框左侧变量列表中选y点击Ø钮进入Dependent框选x1x2x3x4x5x6点击Ø钮进入Covariates框点击Method处拉钮系统提供7种方法:
图88 逻辑回话框
1Enter:变量强制进入回方程
2Forward Conditional:假定参数基础作似然概率检验前逐步选择变量
3Forward LR:局部似然基础作似然概率检验前逐步选择变量
4Forward Wald:作Wald概率统计法前逐步选择变量
5Backward Conditional:假定参数基础作似然概率检验逐步选择变量
6Backward LR:局部似然基础作似然概率检验逐步选择变量
7Backward Wald:作Wald概率统计法逐步选择变量
例选Forward Conditional法便选择作影响素点击Options钮弹出Logistic RegressionOptions话框Display框中选取At last step项求显示终计算结果点击Continue钮返回Logistic Regression话框点击OK钮
8323 结果解释
结果输出窗口中统计数:
Dependent Variable Encoding
Original Internal
Value Value
y 0
n 1
Parameter
Value Freq Coding
(1)
X4 n 5 1000
y 10 1000
系统先字符变量进行重新赋值应变量Y回答(Y)赋值0回答否(X)赋值1应变量X4回答(Y)赋值1回答否(X)赋值1
Dependent Variable Y
Beginning Block Number 0 Initial Log Likelihood Function
2 Log Likelihood 19095425
* Constant is included in the model
Beginning Block Number 1 Method Forward Stepwise (COND)
Improv Model Correct
Step ChiSq df sig ChiSq df sig Class Variable
1 8510 1 004 8510 1 004 8000 IN X3
2 6766 1 009 15276 2 000 9333 IN X6
No more variables can be deleted or added
End Block Number 1 PIN 0500 Limits reached
Final Equation for Block 1
Estimation terminated at iteration number 12 because
Log Likelihood decreased by less than 01 percent
2 Log Likelihood 3819
Goodness of Fit 3000
ChiSquare df Significance
Model ChiSquare 15276 2 0005
Improvement 6766 1 0093
Classification Table for Y
Predicted
y n Percent Correct
y | n
Observed +———+———+
y y | 4 | 1 | 8000
+———+———+
n n | 0 | 10 | 10000
+———+———+
Overall 9333
Variables in the Equation
Variable B SE Wald df Sig R Exp(B)
X3 305171 2980526 0105 1 9184 0000 0000
X6 102797 1079559 0091 1 9241 0000 0000
Constant 1234053 11551065 0114 1 9149
结果表明第步变量X3入选方程分类力达8000第二步变量X6入选方程分类力达9333(参见结果中分类分析表)方程效性χ2检验χ215276P00005
Logistic回分类概率方程:
e1234053305171X3102797X6
P ——————————————
1+ e1234053305171X3102797X6
根该方程胃癌患者营养状态评分(X3)3癌肿病理分度(X6)9P45×1027≈0意味着术发生院感染胃癌患者营养状态评分(X3)1癌肿病理分度(X6)4P098105≈1意味着术会发生院感染
返回目录 返回全书目录
第四节 Probit程
841 功
调程完成剂量效应关系分析通概率单位剂量效应S型曲线关系转化成直线利回方程推算效应水相应剂量值
返回目录 返回全书目录
842 实例操作
[例84]研究抗疟药环氯胍白鼠毒性试验结果表示试计算环氯胍半数致死剂量
剂量(mgkg)
动物数
死亡数
12
9
7
6
5
4
3
5
7
19
34
38
12
5
5
6
11
17
12
2
0
8421 数准备
激活数理窗口定义变量名:剂量DOSE试验动物数OBSERVE死亡动物数DEATH然输入原始数
8422 统计分析
激活Statistics菜单选Regression中Probit项弹出Probit Analysis话框(图89示)话框左侧变量列表中选death点击Ø钮进入Response Frequency框选observe点击Ø钮进入Total Observed框选dose点击Ø钮进入Covariate(s)框拉Transform菜单选Log base 10项(求剂量进行10底数转换)
图89 剂量效应关系分析话框
系统Model栏中提供两种模型概率单位模型(Probit)数然数模型(Logit)例选概率单位模型
点击Options钮弹出Probit AnalysisOptions话框Natural Response Rate栏选Calculate from data项求计算剂量组实际反应率点击Continue钮返回Probit Analysis话框点击OK钮
8423 结果解释
结果输出窗口中统计数:
系统首先显示7组原始数采概率单位模型进行分析回方程参数14次叠代运算确定PROBIT 595215 466313X 该方程拟合优度χ2检验结果χ2 0833P0934拟合良
DATA Information
7 unweighted cases accepted
0 cases rejected because of missing data
0 cases are in the control group
0 cases rejected because LOGtransform can't be done
MODEL Information
ONLY Normal Sigmoid is requested
Natural Response rate to be estimated
CONTROL group is not provided
Parameter estimates converged after 14 iterations
Optimal solution found
Parameter Estimates (PROBIT model (PROBIT(p)) Intercept + BX)
Regression Coeff Standard Error CoeffSE
DOSE 595215 239832 248180
Intercept Standard Error InterceptSE
466313 219942 212017
Estimate of Natural Response Rate 000000 with SE 26448
Pearson GoodnessofFit Chi Square 833 DF 4 P 934
Since GoodnessofFit Chi square is NOT significant no heterogeneity
factor is used in the calculation of confidence limits
Covariance(below) and Correlation(above) Matrices of Parameter Estimates
DOSE NAT RESP
DOSE 575192 82927
NAT RESP 52601 06995
接着系统显示剂量数值(DOSE)实际观察例数(Number of Subjects)试验动物反应数(Observed Responses)预期反应数(Expected Responses)残差( Residual)效应概率(Prob)显示效应概率水剂量值95信区间值例求环氯胍半数致死剂量(Prob 050时)60734795信区间186305—754282
Observed and Expected Frequencies
Number of Observed Expected
DOSE Subjects Responses Responses Residual Prob
108 50 50 4804 196 96082
95 70 60 5917 083 84534
85 190 110 12221 1221 64320
78 340 170 16573 427 48745
70 380 120 11688 312 30757
60 120 20 1682 318 14016
48 50 0 171 171 03413
Confidence Limits for Effective DOSE
95 Confidence Limits
Prob DOSE Lower Upper
01 246942 02752 427407
02 274406 04534 454351
03 293394 06223 472430
04 308539 07895 486574
05 321433 09580 498445
06 332832 11294 508821
07 343158 13047 518134
08 352676 14845 526651
09 361561 16694 534550
10 369937 18597 541954
15 406733 29060 574092
20 438570 41395 601572
25 467862 56021 626792
30 495831 73436 651010
35 523239 94261 675084
40 550646 119286 699754
45 578528 149529 725814
50 607347 186305 754282
55 637600 231299 786673
60 669886 286587 825522
65 704974 354438 875565
70 743943 436394 946545
75 788416 530688 1059748
80 841075 629069 1260617
85 906910 721514 1640564
90 997116 809412 2420725
91 1020216 827760 2673478
92 1045919 846892 2982525
93 1074928 867177 3368627
94 1108278 889128 3864769
95 1147580 913511 4527000
96 1195538 941572 5459759
97 1257252 975590 6885554
98 1344250 1020577 9392908
99 1493751 1092195 15373112
系统输出剂量数值变量X概率单位应变量Y回直线散点图图中点分布状态出回直线拟合程度
图810 剂量效应关系回直线散点图
返回目录 返回全书目录
第五节 Nonlinear程
851 功
调程完成非线性回运算谓非线性回曲线型回分析曲线模型已章第二节中述医学研究中常会遇章第二节中述曲线模型SPSS提供Nonlinear程户根实际需建立种曲线模型研究变量间相互关系医学中细菌繁殖培养时间关系研究助Nonlinear程完成
面曲线模型文中较常见提供户应时作参考:
模型名称 模型表达式
Asympt Regression 1 Y b1 + b2×exp( b3 X )
Asympt Regression 2 Y b1 ( b2 × ( b3 X ))
Density Y ( b1 + b2 ×X ) (1 b3 )
Gauss Y b1× (1 b3×exp( b2 ×X 2))
Gompertz Y b1×exp( b2 ×exp( b3 ×X ))
JohnsonSchumacher Y b1×exp( b2 ( X + b3))
Log Modified Y ( b1 + b3×X )b2
LogLogistic Y b1 ln(1+ b2 ×exp( b3×X ))
Metcherlich Law of Dim Ret Y b1 + b2×exp( b3×X )
Michaelis Menten Y b1×X ( X + b2 )
MorganMercerFlorin Y ( b1×b2 + b3×X b4 )( b2 + X b4 )
PealReed Y b1 (1+ b2 ×exp(( b3×X + b4×X 2+ b5×X 3 )))
Ratio of Cubics Y ( b1 + b2×X + b3×X 2 + b4×X 3 )( b5×X 3 )
Ratio of Quadratics Y ( b1 + b2×X + b3×X2 )( b4×X 2 )
Richards Y b1 ((1+ b3×exp( b2×X )) (1 b4 ) )
Verhulst Y b1 (1 + b3×exp( b2×X ))
Von Bertalanffy Y ( b1 (1 b4 ) b2×exp( b3×X )) (1(1 b4 ))
Weibull Y b1 b2×exp( b3×X b4 )
Yield Density Y (b1 + b2×X + b3×X 2 )(1)
返回目录 返回全书目录
852 实例操作
[例85]选取某某年寿命表中4080岁年龄组尚存数资料表请该资料试拟合Gompertz曲线(Y b1×b2(b3X))
年龄组(岁)
年龄简化值(X)
尚存数(Y)
40
45
50
55
60
65
70
75
80
0
1
2
3
4
5
6
7
8
81277
79258
76532
72850
67568
59911
50800
39325
28074
8521 数准备
激活数理窗口定义变量名:年龄简化值X尚存数Y输入原始数
8522 统计分析
激活Statistics菜单选Regression中Nonlinear项弹出Nonlinear Regression话框(图811示)话框左侧变量列表中选y点击Ø钮进入Dependent框SPSS系统尚法智动拟合户需曲线方面求户估计方程中常数项系数项进行叠代运算起始值方面求户列出方程模型首先点击Nonlinear Regression话框Parameters钮弹出Nonlinear Regression Parameters话框(图812)Name处定义系数名Start Value处输入起始值(项工作十分重否系统法运算甚会叠代次数导致SPSS系统崩溃)例定义b18500b21b315定义系数点击Add钮加确定面运算中出错修改系数项起始值修改点击Change钮加确定然点击Continue钮返回Nonlinear Regression话框Model Expression处写出曲线方程表达式户助系统提供数码盘函数列表写出方程例求计算根回方程求出预测值点击Save钮Nonlinear RegressionSave New Variables话框中选Predicted value项点击OK钮
图811 非线性回话框
图812 系数项定义话框
8523 结果解释
结果输出窗口中统计数:
Iteration Residual SS B1 B2 B3
1 28327193463 850000000 100000000 150000000
11 14333434800 801753427 739240551 150000000
2 14333434800 801753427 739240551 150000000
21 38505E+11 194572013 006502086 21629077
22 8001350196 831858046 842994797 119852430
3 8001350196 831858046 842994797 119852430
31 12857378788 812018322 101579267 142927791
32 5505582751 857742528 850493197 121433127
4 5505582751 857742528 850493197 121433127
41 2057931176 906373496 859429212 125276932
5 2057931176 906373496 859429212 125276932
51 4993788865 922516832 905992700 133942536
6 4993788865 922516832 905992700 133942536
61 4384928143 835035809 966421043 146365602
62 1416572365 914204568 909112694 136083115
7 1416572365 914204568 909112694 136083115
71 8227661248 894400706 923463315 138898940
8 8227661248 894400706 923463315 138898940
81 1741685686 859165498 948299986 145005498
82 4600297866 884676768 930296397 140797724
9 4600297866 884676768 930296397 140797724
91 2761649685 865389357 943736707 144419408
10 2761649685 865389357 943736707 144419408
101 6448300765 856339620 949714917 146896660
11 6448300765 856339620 949714917 146896660
111 4751403684 856809561 949325567 146898044
12 4751403684 856809561 949325567 146898044
121 4751354265 856792273 949338713 146903683
13 4751354265 856792273 949338713 146903683
131 4751354262 856792477 949338590 146903640
Run stopped after 30 model evaluations and 13 derivative evaluations
Iterations have been stopped because the relative reduction between successive
residual sums of squares is at most SSCON 1000E08
Nonlinear Regression Summary Statistics Dependent Variable Y
Source DF Sum of Squares Mean Square
Regression 3 371215833276 123738611092
Residual 6 47513542624 7918923771
Uncorrected Total 9 371220584630
(Corrected Total) 8 282363579356
R squared 1 Residual SS Corrected SS 99983
Asymptotic 95
Asymptotic Confidence Interval
Parameter Estimate Std Error Lower Upper
B1 85679247671 38376368720 84740211757 86618283585
B2 949338590 002336270 943621944 955055236
B3 1469036403 008908976 1447236923 1490835883
Asymptotic Correlation Matrix of the Parameter Estimates
B1 B2 B3
B1 10000 9245 8880
B2 9245 10000 9902
B3 8880 9902 10000
30次叠代运算相邻两次方程剩余均方差值规定1×108满足求回方程决定系数
R2 099983Gompertz曲线方程:
Y 85679247671×094933859(1469036403X)
例求计算预测值系统结果存入原始数库中(图813)系统pred_作预测值变量名结果见预测值实际值十分接
图813 原始数预测值
文档香网(httpswwwxiangdangnet)户传
《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
该内容是文档的文本内容,更好的格式请下载文档