医学统计中基概念
1 医学统计学研究医学数收集整理分析解释呈现结果门学科
2 体:研究基观察单位
3 变量:观察研究象指标
4 观察值:体变量数值
5 资料:称数变量观察值构成
¢ 变异:体观察值间具差异
¢ 变异质统计学数求
¢ 变异统计学研究真正象
¢ 统计学研究变异规律科学
¢ 质:体观察值间变异允许范围
¢ 异质:体观察值间变异超出允许范围
总体抽样样参数统计量
总体:质体构成全体研究象总体时具质变异两特点
限总体:总体中体数量限
限总体:总体中体数量限
¢ 样:总体中机抽取部分体
¢ 样量:样包含体数目
¢ 参数:刻画总体特征指标
¢ 统计量:刻画样特征指标
抽样:总体中机抽取部分体程抽样具代表性机性性性
原:代表性:样充分反映总体特征
机性:保证总体中体相率抽样
机性代表性保证
生活中机性例子(思考题)
¢ 计量资料:连续变量观察值构成资料观察象观察指标定量方法测定数值资料般度量衡单位例年龄身高血糖
¢ 计数资料:离散变量观察值构成资料先观察象观测指标性质类进行分组然计数组数目资料例性患病血型
¢ 等级分组资料:等级变量观测值构成资料具计数资料特征时具半定量性质资料例细菌培养阳性结果
二3种设计类型:完全机设计配设计配伍组设计
三 抽样误差概率概率事件
¢ 抽样误差:抽样引起样统计量总体参数间差异
抽样误差原抽样误差避免
¢ 概率P:表示某事件发生性度量
v 概率事件:统计学惯P≤005P≤001事件称概率事件表示该事件发生性
概率事件统计意义(两面性)
¢ 概率事件会发生者说认次试验中会发生→统计推断基础(正面:应)
¢ 概率事件偶然会发生果发生→统计推断发生错误(反面:警惕)
第二章
集中趋势统计描述
统计描述
总体样具质变异两特征
集中趋势—质统计描述
变异程度—变异统计描述
统计描述通统计量统计图表刻画
频数表直方图
频数表:时列出观察指标取值区间区间出现频数统计表
直方图:垂直条段代表频数分布种图形条段高度代表组频数轴标度组组限横轴标度条段宽度表示组距
频数表直方图途
1 作陈述资料形式
2 便观察数分布类型
3 便发现资料中含异常值
4 组段频率作概率估计值
二均数
均数:描述组观察值集中趋势均水统计指标
均数类型
算数均数(均数):线性尺度均水
均数:数尺度均水
中位数:序尺度均水
百分位数:序尺度均水
均数意义应
均数代表组观察值衡点重心
常称分布尤正态分布
偏态分布时易受极值影响
算术均数
算数均数(均数):线性尺度均水
均数应
均数:数尺度均水
1 均数数等观察值数算术均数
2均数应免疫学(抗体滴度血清凝聚效价)微生物学(细菌计数)等领域观察值般呈等数正态分布
中位数
中位数:组观察值序排列居中心位置数值记M
中位数精确计算
1 观察例数n奇数时中位数序排列第(n+1)2项观察值
2 观察例数n偶数时中位数序排列第n2(n2)+1项观察值均值
百分位数
百分位数Px:指组数中找样数值全部观察值xPx 余(100x)Px
l 定量:频数表图
集中趋势+离散程度
否称
变异系数:两均数相差者变量间变异程度较
l 定性:发病率构成
l 相数注意事项
l 率标化
第三章 变异程度统计描述
度理解
样方差S2总体方差σ2偏估计 E(S2)σ2
n1 度df
度:已知 固定X1X2Xn1Xn必然确定n1独立(变化)体
类型变异程度指标较
正态分布应
正态分布两参数 分表示均数标准差
特征:
1中心称分布
2钟型曲线
3曲线面积分布规律
4两参数决定位置变异
μ0σ1时称标准正态分布
正态分布曲线面积
单侧95双侧901645
μ±σ:68
μ±196σ:95
μ±258σ:99
二医学参考值范围制定方法
()选择定数量参样
(二)选定参样进行准确测定
(三)决定取单侧范围双侧范围值
(四)选择适百分范围
(五)估计参考值范围界限
(三)决定取单侧范围双侧范围值
指标高低均属异常(A) 参考值范围需分确定限限称作双侧参考值范围指标仅高(B)低时异常(C)需确定限限称作单侧参考值范围
(四)选择适百分范围
参考值百分范围应根资料性质研究目选择诊断阈值确定关系百分范围导致假阳性率假阴性率
(五)估计参考值范围界限
参考值范围估计百分位数法正态分布法
总结
衡量变异程度指标
极差四分位数间距方差标准差变异系数
正态分布特征曲线面积分布规律
医学参考值范围制定方法
第四章 抽样误差假设检验
假设检验(基步骤)
1 建立假设确定检验水准
建立假设(反证法假设命题)
效假设H0 μd0
备择假设H1 μd≠0
确定检验水准α(概率事件定义)
α005α001
2 选择检验方法计算检验统计量
3 确定P值作出统计推断结
1)计算获t值概率P值检验水准α较
2)P≤α概率事件发生矛盾拒绝H0 接受H1认μd≠0治疗前血清甘油三酯差异显著统计学意义
3)P> α拒绝拒绝H0 认μd0治疗前血清甘油三酯差异显著统计学意义
假设检验(三基步骤)
1 建立假设确定检验水准
3 选择检验方法计算检验统计量
4 确定P值作出统计推断结
假设检验思路
1 判断两组样代表总体间差异抽样误差总体间质差引起
2 作假设H0:抽样误差引起 H1 :总体质差引起
3 利反证法H0条件计算样统计量
4 利抽样分布原理根样统计量判断抽样结果否概率事件决定否拒绝H0
假设检验基思想
反证法思想
概率事件原理
关α说明
1 检验水准显著性水定义概率事件
2 界值确定常005001某情况取010001
¢ P>005差异没显著统计学意义
¢ P<005差异显著统计学意义
¢ P<001差异极显著统计学意义
¢ 错误说法:显著差异差异否显著专业决定统计学出差异否统计学意义否证表明存差异
3 界值代表容许犯错概率事先确定便移动
假设检验两类错误
1 般反证法绝矛盾
2 假设检验矛盾基概率事件原理—概率事件(P<α)次试验中会发生
l 概率事件发生犯验义错误
l 概率事件发生性α犯验义错误概率α种错误称Ⅰ型错误
l 概率事件没发生接受零假设时犯错误时候错误教条义称Ⅱ型错误
单侧双侧检验—研究目决定第五章 t 检验
t分布特征
¢ 度ν曲线形态t分布簇曲线
¢ 度ν越t分布越接正态分布度ν逼∞时t分布趋标准正态分布
¢ 度较时曲线峰高度低标准正态曲线曲线峰宽度较标准正态分布曲线峰狭尾部面积标准正态曲线尾部面积度越t分布种特征越明显(翘尾低狭峰)
标准正态分布
概率au值关系
标准正态分布中u值尾部面积(概率a)关ua (单侧)ua2(双侧)表示
P度nt值关系
1 t分布中t值Pn关
2 t分布中度定时P越|t|越
3 P定时度越|t|越u值
4单侧时(尾部面积取单侧)t界值表示tan 双侧时表示ta2n 意义
单样 t检验原理
H0 m m0假定认样已知总体中抽取根t分布原理单样t检验公式:
度n=n1
样总体性越:
• 样均数总体均数差越
• 样标准差越
• 样量越
单样t检验应条件:
样资料(n<40)服正态分布样资料
单样t检验——检验步骤
1 建立检验假设确定检验水准
H0:mm0该难产般新生均出生体重相
H1:m¹m0该难产般新生均出生体重
a005001
2 计算检验统计量
μμ0成立前提条件计算统计量:
3 确定P值做出推断结
例度nn135134P>005表明差异统计学意义 a005水准拒绝H0根现样信息尚认该难产般新生均出生体重
配样均数t检验
配样均数t检验:简称配t检验称非独立两样均数t检验适配设计计量资料均数较较目检验两相关样均数代表未知总体均数否差
配设计:受试象某重特征相原配中两体机予(两种处理中)种处理
配设计概述
1 应配设计减少实验误差控制非处理素提高统计处理效率
2 配设计处理分配方式三种情况:
①两质受试象分接受两种处理窝性体重相动物配成性年龄相相病情病配成
②受试象标两部分机分配接受两种处理例52资料
③身(selfcontrast)受试象处理(实验治疗)前结果进行较高血压患者治疗前运动员体育运动前某生理指标进行较
配样均数t检验——检验步骤
1 建立检验假设确定检验水准
H0:md0两种结核菌素皮肤浸润反应总体均直径差异0
H1:md¹0两种结核菌素皮肤浸润反应总体均直径差异0
a005001
2 计算检验统计量
3 确定 P 值作出推断结
度计算 νn112111
P0001<001差统计学意义拒绝H0接受H1
认两种方法皮肤浸润反应结果差统计学意义
两独立样均数t检验
1 两独立样均数t 检验称成组t检验
2 适完全机设计两样均数较目检验两样总体均数否相等
3 完全机设计受试象机分配两组中组患者分接受处理分析较处理效应
两独立样t检验原理
两独立样t检验检验假设两总体均数相等H0:μ1μ2表述μ1-μ20 t统计量计算公式
两独立样t检验——检验步骤
1 建立检验假设确定检验水准
H0:m1m2两种疗法治疗患者血糖值总体均数相
H1:m1¹m2两种疗法治疗患者血糖值总体均数
a005001
2 计算检验统计量
3 确定P值作出推断结
两独立样t检验度 n n1+n22 12+13223
P0001<001a001水准拒绝H0接受H1差异统计学意义
t检验应条件
¢ 计量资料
¢ 样(n<40)求服正态分布(正态性检验进行判断)样
¢ 两组较时求方差齐性(方差齐性检验进行判断)
¢ 组间均衡性
关t检验说明
¢ 关α说明
¢ 均数资料t检验服数正态分布先作数变换作t检验
¢ 数否服正态分布通正态性检验进行判断服正态分布t检验应采秩检验
¢ 数否方差齐性通方差齐性检验进行检验方差齐应采t’检验
关α说明
1 检验水准显著性水定义概率事件
2 界值确定常005001某情况取010001
¢ P>005差异没(显著)统计学意义
¢ P<005差异(显著)统计学意义
¢ P<001差异极(显著)统计学意义
¢ 错误说法:显著差异差异否显著专业决定统计学出差异否统计学意义否证表明存差异
3 界值代表容许犯错概率事先确定便移动
t 检验中注意事项
1 假设检验结正确前提
作假设检验样资料必须代表相应总体时组具良组间均衡性出意义统计结价值专业结
2 检验方法选适条件
应根分析目研究设计资料类型样量等选适检验方法
3 双侧检验单侧检验选择
需根研究目专业知识予选择单侧检验双侧检验中t值计算程相t界值资料作单侧检验更容易获显著结果单双侧检验选择应统计分析工作开始前决定缺乏方面般应选双侧检验
4假设检验结绝化
假设检验统计结正确性概率作保证作统计结时绝化报告结时列出概率P确切数值P 接界值时结应慎重
5 正确理解P值统计意义
P指效假设 H0 总体中进行机抽样观察等现统计量值概率推断基础概率事件原理概率事件次抽样研究中发生发生拒绝H0说明统计学意义显著
假设检验中两类错误
第六章 方差分析
F分布三抽样分布事实基正态分布分布函数F:F分布统计学家RAFisher姓第字母名称F分布目:方差分析协方差分析回分析分析 (A)F分布定义:设XY两独立机变量X度卡方分布MY服卡方分布N 2 独立程度度外购买例量统计分布卡方分布F (米)(Y N)(米n)F分布服度F服程度米第二度Fn密度函数分布样条目 (II)F性质1分布种非称分布 2具两度相应分布F(n1百万1 m11)中n表示? 1通常称作分子度m1通常称作分母度 3 F分布度n 1m1分布族程度参数决定F分布形状 F分布天然互补性:FαDF1DF2 1F1αDF2DF1
样均数两两较
两独立样均数t检验
采次t检验累积Ⅰ型错误概率增加
方差分析思想
说明甲组乙组丙组
首先
次:
方差分析步骤
⒈ 提出检验假设确定检验水准
H0 三组GSH值总体均数相
H1 三组GSH值总体均数全相
⒉ 根公式计算SSMSF值列方差分析表
⒊ 确定P值作出判断
¢ 分子度k12分母度nk33
F2385P<005差统计学意义005显著性水准拒绝H0认三种处理方式鼠GSH值全相
均数间重较
完成方差分析结:
H0:组总体均数相
H1:组总体均数全相
果接受H0 分析完成(F检验次性完成组较控制Ⅰ型错误)
果拒绝H0 接受H1 需进步做重较确定组间差异(post hoc检验)
¢ 重较然采t检验
重较方法
LSDt检验SNKq检验Dunnettt检验
LSDt检验
显著差异(Least significant difference)t检验
SNK-q检验
SNK(StudentNewmanKeuls)检验称q检验
Dunnettt检验
方差分析条件
1 处理组样机独立正态总体
直方图茎叶图粗略估计
PP图QQ图精确估计
偏度系数峰度系数估计
onesample KS非参数检验( D法)
2 处理组样总体方差相等
Bartlett检验法:正态分布资料
Levene检验法:资料分布求(SPSS)
3 正态性方差齐性假设检验
方差分析方差齐性检验较
相点:较方差
点:
目
方差分析较总体均数否相等
方差齐性检验较两总体方差否相
¢ 查表
方差分析单侧F界值表(总体组间≥组)
方差齐性双侧F界值表(总体分子未必>分母)
第七章 相数应
相数种类
率(rate)
构成(constituent ratio)
相(relative ratio)
率(通常针二分类计数资料)
概念:率表示某种现象发生频率强度常百分率()千分率(‰)万分率(万)十万分率(/10万)等表示
计算公式:
注意:例基数通常惯定治愈率感染率百分率出生率死亡率千分率某疾病死亡率十万分率保持率整数位1~2位
构成(通常针分类计数资料等级资料)
概念:称构成指标表示事物部组成部分占整体重通常100%例基数百分表示
计算公式:
注意:组成部分构成100某部分重增部分相应减少
相
概念:相两关联指标描述两者水常R表示
计算公式:
注意:AB倍数表示AB时百分数表示
相种类
1 两类体例数
¢ 两类指标(男:女)
¢ 两类指标(均收入)
2 两率(相危险度RR)
3 两相(值OR)
相数应注意问题
1 构成率相混淆(例71)
2 相数时分母宜(投篮较)
3 注意资料性(医院治愈率较)
4 考虑抽样误差
率标准化
率标准化较两群患病率发病率死亡率等资料时消部构成(年龄性工龄病程长短等)影响年龄会影响死亡率年龄越死亡率越病情越重越难治愈治愈率越低
标准化直接法计算步骤
1 选取标准构成标准构成选取方法三种:
(1)外选取包含较组(区)代表性较稳定数量较构成标准世界全国全省数标准构成
(2)取较组层例数合计标准构成
(3)较组(区)中选构成作标准构成
2 标准构成原分层率计算组预期发生数
3 计算标准化率
医学中常相数指标
1 死亡统计指标
¢ 死亡率:表示某某年1000中死亡数
¢ 年龄死亡率
¢ 死死亡率(十死亡率)
¢ 死构成
2 疾病统计指标
发病率:新发病率表示某时期特定群中患某病新病例频率
患病率:现患病率称现患率表示某时点某群中患某病频率
第八章 卡方检验
A:观察值T:理值四格表度1
连续型分布
检验统计量χ2 值反映实际频数理频数吻合程度
1 检验假设H0π1π2成立四格子实际频数A 理频数T 相差应该统计量χ2 应该
2 果χ2 值相应P 值 P≤α反推断AT相差太超出抽样误差允许范围怀疑H0正确性继拒绝H0接受立假设H1π1≠π2
卡方检验步骤
(1) 建立检验假设确定检验水
H0π1π2 甲药乙药总体效率相等
H1π1≠π2 甲药乙药总体效率等
α005
(2)求检验统计量值
(3) 确定P 值作出推断结
P0251>005α005水准接受H0差异统计学意义认甲乙两种药物治疗冠心病总体效率相等
四格表资料检验应条件:
n≥40T≥5基公式
情况Fisher确切概率法
配四格表资料配专公式
关联性检验 Vs Kappa统计量
Kappa>075致性Kappa<04致性差
n<200 考虑关联性检验n>200考虑Kappa
行×列表资料χ2检验
行数者列数2列联表资料称行×表资料称R×C表资料
卡方检验统计量
基公式
列联表资料检验应条件:
1 T≥15>T≥1格子数超15基公式
2 情况Fisher确切概率法
3 两组组较等级分组资料
非参数检验
实际应中:行列表资料根分类类型研究目选恰检验方法两组组较等级分组资料宜卡方检验
样率间重较
1 四格表资料卡方检验进行两两较
2 检验水准α’αnn检验次数种重检验校正方法称Bonferroni方法
四格表专公式
:1) 种校正称连续性校正
2) 检验P值检验水准a时
改四格表确切概率法
第十章 线性相关回
线性相关基概念
种Y着X变化变化关系称相关关系果种变化呈现直线关系称直线相关(线性相关)简单相关
线性相关系数
相关系数说明具直线关系两变量间相关密切程度相关方统计量
相关系数r没测量单位数值1≤r≤1
相关系数显著性检验
原:根样资料计算出相关系数存抽样误差
举例:假设XY关总体中作机抽样抽样误差影响样相关系数常常等零
结:判断两变量XY总体否真存相关关系需作总体相关系数ρ否零假设检验
进行线性相关分析注意事项
1 线性相关表示两变量间相互关系双分析两变量间底相关关系首先绘制散点图散点图呈现出直线趋势时作分析
2 公式计算出相关系数仅样相关系数总体相关系数估计值总体相关系数间存着抽样误差判断两事物间相关相关密切程度必须作假设检验
3 相关分析相关系数描述两变量间相互关系密切程度方两事物间关系存果关系仅相互伴数量关系证明两事物间确实存果关系必须专业知识加阐明
等级相关系数
1 果观测值等级资料等级相关表达两事物间关系
2 常等级相关计算方法Spearman等级相关系数
线性回方程显著性检验
1 线性回方程进行假设检验检验b否β0总体中机样该假设检验通常采方差分析者t检验两者检验效果等价
2 t检验:
3 方差分析:
进行线性回分析注意事项
⒈ 两联系变量进行回分析意义
⒉ 作回分析时果两联系变量间存种存果关系应该变量X 果变量Y
⒊ 回分析中求变量变量服正态分布
⒋ 回方程建立必须作假设检验假设检验拒绝效假设回方程意义
⒌ 回方程计算估计值时估计范围扩建立方程时变量取值范围外
线性相关回区联系
1 线性相关表示两变量间相互关系双回反映两变量间存关系单
2 果资料进行相关回分析相关系数r回方程中b正负号相
3 相关分析中求出r进行假设检验样回分析中b进行假设检验样两种假设检验等价
4相关回互相解释
直线回:研究两变量间数量存关系
直线相关:研究两变量间相互联系方密切程度
r表示两机变量间呈直线相关强度方统计量
直线回:求Y服正态分布X控制精确测量
直线相关:求XY服正态分布
r085关系密切?说程正相关
总复
计量资料:连续变量观察值构成资料观察象观察指标定量方法测定数值资料般度量衡单位例年龄身高血糖
计数资料:离散变量观察值构成资料先观察象观测指标性质类进行分组然计数组数目资料例性患病血型
等级分组资料:等级变量观测值构成资料具计数资料特征时具半定量性质资料例细菌培养阳性结果
统计推断
参数估计
s未知n
s未知n足够
s已知
2.两种方法检验已确诊肝癌患者120名 资料
甲法 乙法 合计
+ -
+ 42 30 72
- 18 30 48
合计 60 60 120
(1)请解释表中4218两数字意义
2c (2)请通 检验说明两种方法检查阳性检出率差
解:
(1)请解释表中4218两数字意义
42表示两种方法检验结果致例数18指两者致例数(4分)
2c(2)请通 检验说明两种方法检查阳性检出率差
1)检验假设:H0:两法检验结果差致
扣1分)a005(2分未H0a H1:两法检验结果差致
2)计算统计量:配四格表b+c48>40校正法(3分校正公式扣1分)
3)确定P值作结:度1界值
< 005拒绝H0认甲法乙法检验结果差(3分未实际结扣1分)>P
Chapter 基概念
显著性检验(test of significance):计算P值
医学统计工作容:
1实验设计:关键重
2收集资料:基础
原始资料:实验数
现场调查资料
医疗卫生工作记录
报表
报告卡
质量控制——精度偏倚
3整理资料
(1) 资料逻辑检查(坏数)
(2) 致性检查
(3) 原始数加工:频数分布表
4分析资料:统计描述(表图离散趋势集中趋势)统计推断
统计描述类型选择:
集中趋势 离散趋势
称正态 μ
数正态 G S lgX
偏态 M QR
单位均数差 CV
医学统计资料类型:计量资料计数资料等级分组资料
医学统计学象:变异事物
总体样:
总体(population)特性:质性量性差异性
抽样
总体
样
参数
统计量
推断
抽样求:代表性机性性性
样三性:代表性机性性
性(reliability):实验结果具重复性科研课题样出结推测总体结较信度
两样间具:性
误差类:
1系统误差(system error):资料收集程中仪器初始状态没调零标准试剂未矫正标准指定偏高偏低等原造成观察结果倾性偏偏必须克服
2机测量误差(random measurement error):避免系统误差情况种偶然素影响造成象次测量值致
3抽样误差(sampling error):抽样造成样统计量总体参数间差避免样含量越抽样误差越均数抽样误差:
概率(probability):P(A)
概率事件:P≤005(统计学意义)P≥001(高度统计学意义)
Chapter 集中趋势统计描述
手工整理资料频数表(frequency table)步骤:
1求极差(全距)
2确定组数组距
参考组距全距 组数
3确定组段
4手工编制划记表
直方图(histogram):
高度:组频数 轴
宽度:组距 横轴表示组限
均数(average):
适:称分布偏度资料尤适合正态分布
1算术均数(mean):
2加权均数:
3均数:
中位数(median):观察值排列时居中心位置数值
适1分布明显成偏态时2频数分布端两端确切数值时便统计计算
M:中位数LM:M组限f L:M组前积累频数fM:M组频数i:组距
百分位数(percentile):Px组中找样数值P全部观察值xPP75P25描述资料离散程度
众数:组观察值中出现频率高观察值分组资料频率高组组中值适样粗糙
Chapter 离散程度统计描述
离散表述指标:
1间距计算:极差四分位数间距
2均差距:离均差方方差标准差变异系数
极差(rangeR):全距粗略适分布
四分位数间距(quartileQ):组观察值排序分成四数目相等段落段落观察值数目占总例数25掉两端含极端数值25取中间50观察值数范围~
越数变异越适偏态分布
QP75 P25
离均差方(sum of square of deviation):
方差(variance):
样方差
总体方差
标准差(standard deviations):
适似正态分布
ps1合资料直接计算
2均数结合完整概括正态分布
变异系数(CV):均属相差交单位组数观察值较
CV
正态分布(normal distribution):
1正偏态分布:高峰左长尾右
负偏态分布:高峰右长尾左
2μσ正态分布总体两参数应样统计量中SX实际应中μσ通常未知SX作总体参数估计量
注意:
2μ位置参数σ变异参数
描述方法:N(μσ2)
3曲线面积意义:X1~X2出现概率
μ±σ 683
μ±196σ (单侧μ±1645σ) 95
μ±258σ(单侧μ±233σ) 99
标准正态分布(standard~):μ0σ1正态分布
参数μσ正态分布通变量变换转化成标准正态分布:
医学参考值范围(reference value range)制定方法:
1选择足够数量正常作参样
2选定参样进行准确测定
3决定取单侧范围双侧范围值
4选择适百分范围
5估计参考值范围界限
Chapter 抽样误差信区间
中心极限定理:样含量情况(n≥50)样测量量(X)服什分布样均数抽样分布似服μ均数正态分布N(μσ2n)
标准误(standard error):样均数间变异标准差
实际工作中总体标准差σ 未知样标准差S代:
标准差标准误区:
标准差
标准误
含义
描述观察值变异程度指标
描述样均数抽样误差指标
公式
()
意义
标准差较表示观察值围绕均数波动较
说明样均数代表性
表明样均数围绕总体均数波动较
说明样均数性
应
1表示观察值变异程度
2结合样均数描述正态分布资料特征确定医学参考值范围
3计算标准误
4计算CV
1估计样均数抽样程度
2估计总体均数信区间
3进行假设检验
n↑
趋稳定(σ)
逐渐减
标准误(公式)意义:
1标准差联系:样含量定情况标准误标准差成正
(1) 观察值变异(标准差)较时样均数间抽样误差较抽样均数总体均属相差较估计μ性较
(2) 观察值变异较时样均数间抽样误差较抽样均数总体均属相差较估计μ性较差
2样含量关系:方根成反说明总体中机抽样样含量越标准误越
3标准误反映样均数间离散程度反映样均数总体均数差异
参数估计(parameter estimation):指偶样参数估计总体参数统计推断重容常方法点估计区间估计
点估计(point ~):单数值直接作总体参数估计值适种资料
区间估计(interval ~):预先定概率计算出区间够包含总体参数定概率(1α)称信度计算区间称信区间(confidence intervalCI)
信区间通常包括两数值界定信限(confidence limit)分限限
总体均数估计95信区间表示:该区间95概率包含总体均数μ注意说总体均数95概率落区间里
信区间估计效果较:
1(1α)越接1越概率↑
2区间宽度越窄越精确度↑
两者矛盾般选择(1α)95
t分布(t distribution):0中心称分布时t分布极限分布标准正态分布正态分布总体中进行抽样服度t分布
tα度关
信区间计算:
n≥50t分布接标准正态分布简化
σ已知简化
Chapter 假设检验
假设检验(hypothesis test):
目:较总体参数差
基思想:首先需较总体提出差假设然通样数推断否拒绝假设
基方法:反证法概率事件
基步骤:
1建立假设确定检验水准
效假设(null hypothesis):H0:μμ0(μd0)总体均数差
备择假设(alternative ~):H0:μ≠μ0(μd≠0)总体均数差
假设单侧双侧两种应单侧检验定硬专业知识般选双侧检验双侧检验出显著差结单侧检验结定显著差然反然
检验水准称显著性水准(significance level)α表示预先设定拒绝域概率值般取005
2选择检验方法计算检验统计量
t
正态分布(似)样(n<50)
u
1种分布样(n≥50时)
2σ已知正态分布样
F
方差分析
1独立水k≥3
2均正态分布总体
3方差齐
推断22总体率构成间差
非参
1总体分布偏态未知
2数偏某段确定
3等级资料
3确定P值做出统计推断结
P值意义:假设检验结指原假设成立条件观察样差机遇致概率
结:
1p<α样数差异显著统计学意义拒绝H0接受H1
2P>α样数差异显著统计学意义根现样足拒绝H0(等接受H0)
单样t检验:
条件:μSn
1H0:μμ0 α005双侧检验
2t
3
配样t检验:
条件:n指标1指标2(d∑d∑d2)
1H0:μd0α005
2t
3
成组设计实验两样均数较
条件:n1n212S1S2
1H0:μ1μ2
2u
3
F检验:
条件:表格略
1H0:组总体均数相
H1:组总体均数全相
2
vTRk1vEnk
3F符合度(k1nk)F分布
F值接1认均值源机波动F>1F>Fα(k1nk)P<α……
假设检验中两类错误:
1第类错误:H0真时拒绝H0接受H1称假阳性错误(阳性指两者总体参数差异)检验水准α预先规定犯第类错误概率值
2第二类错误:H0假时拒绝H0称假阴性错误概率β表示取单侧般未知
证α越β越α越β越越时减少第类错误第二类错误唯方法增样含量
简单四格表检验:
效
效
合计
药物1
a
b
a+bn1
药物2
c
d
c+dn0
合计
a+cm1
b+dm0
N
1H0:α005
2
n≥40T≥5时四格表专公式
n≥401
n≤40T≤1时Fisher确切概率公式
3384663
配四格表检验:
组
病例组
合计
暴露史
暴露史
暴露史
a
b
a+bn1
暴露史
c
d
c+dn0
合计
a+cm1
b+dm0
N
1H0:α005
2
b+c≥40时
b+c<40时
3384663
行*列资料检验:
效
效
合计
药物1
a
b
n1
药物2
c
d
n2
药物3
e
f
n3
合计
m1
m2
N
1H0:组效率相
H1:组效率全相
2
(行数1)(列数1)
3
Chapter 相数应
相数(relative number):两关数两关统计指标常:率值构成
率(rate):表示定范围某现象发生数发生总数
构成(constitute ratio):表示某事物部组成部分总体中重
相(relative ratio):AB两关联指标描述两者水RR
总体均数
总体标准差
总体率
四分位数间距
总体相关系数
第二类错误概率总体回系数
CV 变异系数
β
CI 信区间
M中位数
P50 50
SMR实际死亡数预期死亡数
— END —
文档香网(httpswwwxiangdangnet)户传
《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
该内容是文档的文本内容,更好的格式请下载文档