统计学基问题根样提供信息总体分布分布数字特征作出统计推断统计推断包括两部分:统计估计二假设检验
统计估计问题根样数字特征估计总体参数数字特征通常称作参数估计参数估计根出结方式两种形式:点估计区间估计
假设检验关总体分布数字特征分布函数做假设进行检验判断正确性假设检验分两类:类总体分布数字特征进行检验称参数假设检验类求根样提供信息关分布函数假设进行检验时检验分布参数作检验称作非参数假设检验非参数检验第六章进行讨章着重讨参数检验
第节 点估计
点估计极似然法
点估计单数总体参数值作出估计未知总体参数时未知常数根抽样样观察值构造统计量()估计总体参数抽样机性统计量机变量点估计具体值作估计值显然样做必然会误差产生种误差称抽样误差
极似然法种参数点估计重方法先例子说明原理
例51设批产品质量分正品次品产品次品率两种估计:0104机抽样15件产品发现件次品现根抽样情况决定种次品率估计更呢?
记 A 抽取15件产品件次品设抽正品X0抽次品X1表示抽样结果 X0 X1 两种情形事件 A发生概率:
P(A)
中:批产品次品率
次品率01P(A)×0100229
次品率04P(A)×0400003
现事件A 然次观察中发生直观认事件A发生概率P(A)会应选择P(A)较次品率作产品次品率估计更
00229>00003应选择01作产品次品率选择04更
例推广般情形极似然法般原理设取密度函数f(x )总体组样中:x参数估计极似然估计基思路记A 次观察中组样样值( )现次观察中A发生P(A)应应取值集合中选出P(A)达值作估计值时称极似然估计值 相互独立X具相分布P(A)相事件: 时发生概率P(A)记L()L() :
L()
L()称似然函数求极似然值问题求似然函数L()值问题根微分学结果L()取值必条件导数零ln L()L()取极值点相计算方便通常数似然方程求解似然估计值
述例子中f(1 )f(0)1似然函数:
L()
令0舍1似然估计值0067
实际正15次抽样中次次品频率频率估计概率n充分时疑合理
例52正态总体中抽取容量n样求总体参数极似然估计
解:构造似然函数
求ln极令
解述方程:
极似然估计量:
二估计量坏评选标准
前面讨利极似然法求参数估计量参数方法求估计量参数估计中存样选择较统计量推断总体参数理问题什样估计量估计量呢估计进行评价问题请面例子
例53假某建设单位购进批建筑线材需解批线材均抗拉强度少现通抽样选择样某函数(统计量)推断总体指标值机原次抽取样测量结果果样容量3抽取4组样测结果表51示
表51 组抽样样观察值
样值
样序
均值
1
900
999
1011
970
2
995
1050
1105
1065
3
1010
941
890
947
4
950
910
1140
1000
说明方便起见假定实际μ1000公斤然事先知道求利样信息推断总体指标误差第组样中位数接总体指标第二组样值接总体指标第三组样值接总体指标第四组样均值刚等总体指标产生问题量实验中究竟采指标推断总体指标更合理呢?
评价点估计结果通常偏性效性致性等标准
1 偏性
偏性含义样机原偏偏然估计量均应该等估计指标直观意义估计量值应参数真值周围摆动系统误差般偏性定义:设估计参数估计量( )切n称偏估计量
=b称b估计量偏差b≠0称偏估计量果称渐偏估计量
重复抽样重复抽样样容量样均值样例总体均值总体例偏估计样方差总体方差偏估计量果定义
:
产生偏差原总体方差偏估计应该抽样时μ未知估计量代根方原理变量X距样均值离差方代μ计算方差低估偏估计令
时偏估计
样方差差称偏差n时渐偏差估计样容量时直接样方差作总体方差估计值样容量较时偏差较
图51 估计偏性效性
2 效性
符合偏性求估计统计量抽取样时会产生误差误差量求估计量围绕真值变动愈愈说求统计量离散程度者说方差般效性定义:设未知参数两估计量意正常数c称效效性反映估计量分布集中程度估计量分布越集中参数真值附估计效率越高图51示
方便起见实际效性定义:未知参数两偏估计量V()V()分表示方差V()V()<1称效
例正态总体利样均值样中位数M估计总体均值时均偏估计末更效呢?
均值抽样分布统计证明中位数分布说明效样均值估计总体均值中位数估计总体均值效率高换句话说中位数估计总体均值均误差样均值估计总体均值时更果中位数作估计量达样均值作估计量样程度增加样设均值估计样中位数估计样设估计效率相等方差相等157中位数估计时样均值估计时抽57样单位
3 致性
统计量样容量n增加断趋总体指标n→∞(限总体n→N)时估计值总体参数完全致般点估计致性定义:设 ( )未知参数估计量概率收敛致估计量
现样均值统计量否符合致性求根切雪夫等式:
令
时
致性极限意义说明统计量总体参数关系种性质样容量时起作外符合致性统计量止仅考虑致性够事实证明总体正态分布时中位数统计量符合致性求样值值抽样中取效果总体估计量
第二节 区间估计
区间估计概念步骤
点估计确定值估计未知参数具较风险估计量机抽取样结果带机性样估计量刚等估计总体参数性极果说估计总体参数落估计值附估计总体参数落点估计估计值中心某区间较握种方法区间估计法
第四章中已知道足够样均值抽样分布正态抽样均值落总体均值两侧范围概率0683落总体均值范围概率0955落总体均值范围概率0997等等见概率估计总体均值落某区间范围种总体均值估计称作区间估计述说明:
1 果估计区间越参数包含该区间概率越
2 果样方差越相概率区间估计结果越短
般设总体未知参数分组样确定两估计量定P()称区间[]置信度置信区间分置信区间限限称置信度置信概率表示区间估计度称置信度水
常置信度 080090095 099等般说估计求较精确问题置信程度求高社会济现象中通常采95置信度反表示犯错误概率置信度95犯错误概率1955概率置信度水理解风险率风险水
图52 根样置信度955置信区间
需指出P()应理解落某固定区间概率里参数机变量根抽样结果计算出[]机区间样产生估计区间[]述概率理解机区间[]中包括参数概率
图52表示根样置信度955置信区间总体均值位置关系样置信区间中955区间包括总体均值说估计区间包括总体均值具955置信度
二单总体参数区间估计
()正态总体方差已知总体均值区间估计
根第四章关样均值分布结果
~N(01)
定估计置信度时
根原理样均值推断总体均值区间估计值样均值时规定置信度总体均值区间估计公式
置信区间估计图53表示
述估计公式仅适限总体情形限总体放回抽样说果总体规模N样n区间估计公式中需修正系数总体均值区间估计公式变
图53 置信度置信区间
述说明中总结出正态总体方差已知总体均值区间估计步骤:
1 计算出样统计量确定该统计量抽样分布例总体正态样均值必然服正态分布
2 根研究目确定置信度置信度水求置信度置信度水查出相应系数
3 计算样均方差抽样标准误
4 述数代入公式区间估计结果
实步骤样适类型区间估计问题
(二)非正态总体方差未知样总体均值区间估计
实际中遇总体定服正态分布总体方差未知种情况推断总体均值助中心极限定理需抽取足够样样样均值服正态分布时总体方差未知样足够时般时样标准差代总体标准差直接S代入式中
(三)正态总体方差未知样总体均值区间估计
总体方差未知情况果抽取样必须采估计办法已知服t分布度n1利t分布进行估计时
前面样述估计公式仅适限总体情形限总体说果总体规模N样n放回抽样情形区间估计公式中需修正系数
(四)总体例区间估计
根第四章关样例分布结果
样例时规定估计置信度总体例区间估计公式
里问题确定总体例置信区间时身恰恰估值点估计理知道样例总体例P偏估计估计样例方差时直接样例代总体例P样容量n足够满足5保证结果总体例置信区间:
然限总体放回抽样情形样需修正系数
(五)正态总体方差区间估计
第四章关分布结果中介绍正态总体组样方差总体方差服分布
~
定置信度利分布特性查表
总体方差区间估计
三两总体参数区间估计
()两总体均值差区间估计
1 两正态总体方差已知样
两总体中抽取样样两总体方差已知时两样均值差服正态分布时
置信度水情况置信区间
2 两正态总体方差未知相等样
两样样时两样均值差服正态分布假设两总体方差相等未知需根样方差进行估计样方差具机性般合推算总体方差
两样均值差抽样分布方差
两总体均值差估计置信区间
3 两正态总体方差未知相等样
根章结果总体方差未知时样方差代总体方差样相应统计量服正态分布服t分布样时样应两样合起代总体方差
度两总体差区间估计结果
(二)两总体例差区间估计
根两样例差抽样分布两样例差均值两总体例差两样例差方差
两例样容量样时两例差服正态分布置信度时两总体例差置信区间:
(三)两正态总体方差区间估计
根第四章介绍F分布结果两正态分布总体总体方差样方差构成统计量
定置信度水F分布表查置信区间界值:
置信度1置信区间
第三节 样容量确定
区间估计中发现某总体参数进行估计时样数目定条件提高估计结果性需扩置信区间增加估计中误差减少估计实际意义果减少估计误差缩短置信区间样必须降低估计性见样数目定条件估计精确性估计性两全美提高估计精确性减少误差提高估计性办法增加样容量增加样时增加抽样调查成时延误时间需研究够满足估计性精确性求样数问题
均值估计问题中样决定
总体均值估计问题中决定必样必须先明确三问题:
1 规定允许估计误差允许估计值实际值间偏离值少实际估计区间
2 规定置信度估计求达性实际抽样误差超规定误差信度
3 明确总体标准差求解总体分布情况总体标准差抽较少样满足估计精确度性求总体标准差必须抽取较样达估计精确度性求
设总体标准差样均值标准差估计置信度相应置信系数总体均值估计式:
式中实际表示估计允许误差Δ表示根式
规定允许误差Δ总体标准差σ置信度查表相应代入公式求满足求整数满足估计误差Δ置信度求少样数
述公式适重复抽样限总体放回抽样时情形限总体放回抽样情形公式变形式:
求满足式求整数
中:Δ允许误差
限总体体数
置信度水
根置信度水查表置信系数
二例估计问题中样决定
关总体例估计问题中决定样首先明确关均值估计问题中样三问题:
1 允许误差规定估计值实际值偏离值
2 规定置信度估计求达信度
3 总体例事先估计值致估计总体例少
均值估计问题完全行结果
重复抽样限总体重复(放回)抽样时情形
限总体放回抽样情形公式变形式:
第四节 假设检验
假设检验基原理
假设总体均值某值检验假设正确性收集样数计算出假设值样均值间差异然根差异判断作假设正确性假设检验直观知道差异越总体均值假设正确性愈差异越总体均值假设正确性愈
然数情况总体参数假设值样统计量间差异显易见应该拒绝假设完全肯定应该接受假设程度简单决定接受拒绝作假设需判断作假设程度正确需研究假设判断假设否正确程度
()假设检验中假设
假设检验中通常检验假设称作原假设零假设记作例检验总体均值μ100假设否正确表示μ100果样提供信息法证明原假设成立拒绝原假设时接受外备选假设称备择假设表示备择假设备择假设三种形式例原假设μ100条件备择假设:
μ100表示备择假设总体均值等100者
μ>100表示备择假设总体均值100者
μ<100表示备择假设总体均值100
述备择假设选择检验求密切相关根假设检验目求假设检验分双侧检验单侧检验
果样均值高低假设总体均值显著时拒绝原假设称作双侧检验双侧检验时左右两拒绝区域原假设:μ100备择假设:μ100时必须双侧检验
样均值高(低)假设总体均值显著时拒绝原假设称作单侧检验单侧检验拒绝区域假设检验样均值高假设总体均值显著时拒绝原假设种假设检验称作右侧检验时原假设实际变μ100备择假设μ>100反果样均值低假设总体均值显著时拒绝原假设称作左侧检验时原假设实际变μ100备择假设μ<100见原假设备择假设总排性
(二)检验显著性水
假设检验需确定接受拒绝原假设标准标准显著性水谓检验显著性水表示假设正确条件落某界限外样均值占百分具体说5显著性水检验假设说假定总体参数作假设正确样均值假设总体均值差异100样中应超5果样均值总体均值差异超数目认样抽假设总体拒绝零假设
图54直观解释假设检验原理假设检验显著性水5已知概率密度曲线包括假设均值两侧直线间面积95两边尾端面积25样均值落95区域认样统计量假设总体参数差异显著结果接受原假设样统计量落左右尾端25区域差异显著拒绝原假设接受备择假设
图54 假设检验接受区域拒绝区域
应该强调指出假设检验中接受原假设意思仅仅意味着没充分统计证拒绝原假设假设检验中接受原假设特定含义拒绝原假设实际样统计量落95面积证明原假设正确知道总体参数真实值假设值完全相证明假设正确法知道总体参数真实值
定检验显著性水根假设确定接受拒绝原假设区域范围果样均值落某区域接受原假设称区域接受区域果样均值落某区域拒绝原假设称区域拒绝区域
显著性水选择没唯通标准实际显著性水检验某假设必须注意选择什样显著性水存假设真拒绝性方面检验假设时显著性水愈高原假设真时拒绝概率愈高需研究假设检验中错误进行讨
二假设检验步骤
1 提出原假设备择假设原假设备择假设必须题意决定般情况总检验目作备择假设样充分握拒绝原假设
2 选择检验显著性水确定检验拒绝区域界点表示假设检验时原假设真拒绝原假设接受备择假设错误概率假设检验中犯种错误面讨
3 确定样统计量分布样统计量称检验统计量统计量具分布检验假设根检验假设正确选择检验统计量
4 计算检验统计量作出决策根样数计算出检验统计量值果统计量值落拒绝区(包括界点)说明原假设样反映情形显著差异应该拒绝原假设果统计量值落接受区域说明原假设样反映情形差异显著应该接受原假设
三种常假设检验
() 均数假设检验
1 双侧检验
研究面例子
例54某食品厂规定某种罐头罐标准重量500克年验表明厂罐重量标准差15克机抽取49罐头发现罐头均重量506克问005显著性水否认批罐头重量符合标准求?
检验批罐头重量否符合标准求检验批样均重量标准重量间否具明显差列出检验假设:
μ500
μ500
双侧检验问题根区间估计结知原假设接受区域
置信度水005196接受区域[49585042]现样实际均值506落拒绝区域拒绝原假设接受备择假设法认批罐头重量符合标准求批罐头重量符合标准求
总体方差未知样数量等30时检验统计量样均值服t分布t分布确定原假设接受区域拒绝区域接受区域利面样方法根样均值处位置作出判断
2 单侧检验
面例子
例55某饮料厂规定某种纸罐包装饮料容量少500ml机抽取25纸罐发现罐头均重量498 ml标准差S10问005显著性水否认批纸罐容重符合标准求?
根问题求列出检验假设:
μ500
μ<500
总体方差未知样容量30检验统计量服t分布度n1必须利t分布进行检验单侧(左侧)检验问题根区间估计结知原假设接受区域
根置信度水005查表计算接受区域界点4966现样均值498>4966见样均值落原假设接受区域接受原假设认批纸罐容重符合标准求
例56某特种建材生产厂规定某种规格新型墙体材料重量500公斤机抽取16块种规格新型墙体材料测均重量505公斤标准差S10问005显著性水否认批新型墙体材料重量符合标准求?
次检验假设:
μ500
μ>500
次需利t分布进行检验右侧检验问题原假设接受区域
根置信度水005查表原假设接受区域界点5044现样均值505>5044见样均值落原假设拒绝区域拒绝原假设接受备择假设认批新型墙体材料重量符合标准求
(二)例假设检验
例57某酒厂规定某种酒中含糖度应12产品算合格机抽取100瓶种酒发现均糖度113问显著性水010条件批酒合格产品糖度求明显差?
问题检验假设:
μ012
μ012
例双侧检验问题根区间估计结果原假设接受区域
010164计算原假设接受区域[01140126]样例0113<0114落原假设拒绝区域拒绝原假设接受备择假设认批酒合格产品糖度求明显差
例问题样进行单侧假设检验方法总体均值单侧检验情形相
外参两总体区间估计情形两总体均值例差进行假设检验方法完全样
四假设检验中两类错误
假设检验根概率进行判断判断失误三种显著性水例001010050时进行假设检验结果完全组样均值位置001010显著性水接受零假设050显著性水拒绝零假设见采高显著性水接受正确零假设拒绝掉正确零假设
假设检验中果原假设正确拒绝时称犯第类错误弃真错误犯第类错误概率记作相反果原假设错误接受时称作犯第二类错误取伪错误犯第二类错误概率记作表53表示两者间关系两种错误互相补说样容量定情况减少第类错误概率增加发生第二类错误概率反样实际减少第类错误概率增接受区域减少拒绝区域时接受区域增正确原假设接受概率增增加图54示减少接受正确原假设概率减少值时正确零假设接受概率减少着拒绝区域增正确零假设拒绝概率升增图54示
表52 两类错误间关系
接受
接受
真
正确
弃真第类错误概率 α
假
取伪第二类错误概率β
正确
图55 假设检验中两类错误
两类错误间种补关系理决定检验第类错误第二类错误显著性水时具体考察两类错误相联系费造成损失决定究竟宁发生第类错误愿发生第二类错误宁发生第二类错误愿发生第类错误
练题
51 某机器生产滚动轴承机抽取196样测直径均值0826厘米样标准差0042厘米求批轴承均值9599置信区间
52 某灯泡厂生产灯泡均寿命1120时现批新生产灯泡中抽取8样测均寿命1070时样方差()试检验灯泡均寿命变化(005001)?
53 设正态总体方差已知问抽取样容量n应总体均值置信度095置信区间长L
54估计总体均值时求置信度99条件保证样均数总体均值间误差超标准差25问应抽取少样?
55降低贷款风险某银行部规定求均笔贷款数额超120万元着济发展贷款规模增趋势现n144样测均贷款额1281万元S45万元001显著水检验贷款均规模否明显超120万元
56 正常脉搏均72次/分某种疾病患者10测脉搏54 63 65 77 70 64 69 72 62 71(次/分)设患者脉搏次数服正态分布试显著性水005检验患者正常脉搏显著差异?
57 A市16名学生测智商均值107样标准差10B市16名学生测智商均值112标准差8问两组学生智商显著差?
58 简单机重复抽样方法选取样时果抽样均误差降低50样容量需扩原( )(单选题)
A 2倍 B3倍 C4倍 D5倍
59 某产品规定标准寿命1300时甲厂称产品超规定机选取甲厂100件产品测均值1345时已知标准差300时计算样均值等1345概率0067μ1300μ>1300情况( )成立(单选题)
A 005接受 B 005接受
C 010接受 D 010拒绝
510面关假设检验陈述正确( )(选题)
A 假设检验实质原假设进行检验
B 假设检验实质备择假设进行检验
C 拒绝原假设时认肯定根尚充分认绝错误
D 假设检验根样结果简单直接判断原假设备择假设更正确
E 接受原假设时认否定根尚充分认绝正确
511 某种新型建材单位面积均抗压力服正态分布均值5000公斤标准差120公斤公司次50块种新型建材样进行检验决定批建材均抗压力否5000公斤公司规定样均值4970算合格求种规定犯第类错误概率
文档香网(httpswwwxiangdangnet)户传
《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
该内容是文档的文本内容,更好的格式请下载文档