应用统计ch6.ppt
《应用统计ch6.ppt》由会员分享,可在线阅读,更多相关《应用统计ch6.ppt(108页珍藏版)》请在沃文网上搜索。
1、应用统计第六章:假设检验第六章:假设检验假设检验在统计方法中的地位假设检验在统计方法中的地位假设检验假设检验假设检验的基本问题假设检验的基本问题 一个总体参数的检验一个总体参数的检验两个总体参数的检验两个总体参数的检验假设检验的基本问题假设检验的基本问题假设的陈述假设的陈述假设检验的原理假设检验的原理两类错误与显著性水平两类错误与显著性水平统计量与拒绝域统计量与拒绝域利用利用P值进行决策值进行决策什么是假设什么是假设?(hypothesis)对对总总体体参参数数的的具具体体数数值值所作的陈述所作的陈述总总体体参参数数包包括括总总体体均均值值、比例比例、方差方差等等分析分析之前之前必需陈述必需陈
2、述我认为这种新药的疗效我认为这种新药的疗效我认为这种新药的疗效我认为这种新药的疗效比原有的药物更有效比原有的药物更有效比原有的药物更有效比原有的药物更有效!什么是假设检验什么是假设检验?(hypothesis test)1.先先对对总总体体的的参参数数(或或分分布布形形式式)提提出出某某种种假假设设,然后利用样本信息判断假设是否成立的过程然后利用样本信息判断假设是否成立的过程2.有参数检验和有参数检验和非非参数检验参数检验3.逻辑上运用反证法,统计上依据小概率原理逻辑上运用反证法,统计上依据小概率原理4.4.如如果果对对总总体体的的某某种种假假设设是是真真真真实实实实的的,那那么么不不利利于于
3、或或不不能能支支持持这这一一假假设设的的事事件件A A(小小概概率率事事件件)在在一一次次试试验验中中几几乎乎不不可可能能发发生生的的;要要是是在在在在一一一一次次次次试试试试验验验验中中中中A A A A竟竟竟竟然然然然发发发发生生生生了了了了,就就有有理理由由怀怀疑疑该该假假设设的的真真实实性,性,拒绝拒绝拒绝拒绝这一假设。这一假设。假设检验的基本思想假设检验的基本思想.因此我们拒因此我们拒因此我们拒因此我们拒绝假设绝假设绝假设绝假设 =50=50.如果这是如果这是如果这是如果这是总体的真实均总体的真实均总体的真实均总体的真实均值值值值样本均值样本均值 =50抽样分布抽样分布抽样分布抽样分
4、布抽样分布抽样分布H H0 0这个值不像我这个值不像我这个值不像我这个值不像我们应该得到的们应该得到的们应该得到的们应该得到的样本均值样本均值样本均值样本均值 .20200.05假设检验的过程假设检验的过程总体总体总体总体抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 x x =20=20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设提出假设提出假设 拒绝假设拒绝假设 别无选择别无选择!作出决策作出决策作出决策作出决策假设检验的过程假设检验的过程总总 体体(某种假设)(某种假设)抽样抽样样样 本本(观察结果)(观察结果)检验检验(不拒绝不拒绝)(拒
5、绝)(拒绝)小概率事件小概率事件未未 发发 生生小概率事件小概率事件发发 生生原假设原假设(null hypothesis)1.研究者想收集证据予以反对的假设研究者想收集证据予以反对的假设2.又称又称“0假设假设”3.总是有符号总是有符号,或或4.表示为表示为 H0H0:=某一数值某一数值 指定为符号指定为符号=,或或 例如例如,H0:10cm为什么叫零假设?为什么叫零假设?之所以用零来修饰原假设,其原因是原假设的之所以用零来修饰原假设,其原因是原假设的内容总是没有差异或没有改变,或变量间没有内容总是没有差异或没有改变,或变量间没有关系等等关系等等零假设总是一个与总体参数有关的问题,所以零假设
6、总是一个与总体参数有关的问题,所以总是用希腊字母表示。关于样本统计量如样本总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等因为样本统计量是已知的,当然能说出它们等于几或是否相等于几或是否相等备择假设备择假设(alternative hypothesis)1.研究研究者想收集证据予以支持的假设者想收集证据予以支持的假设2.也称也称“研究假设研究假设”3.总是有符号总是有符号,或或 4.表示为表示为 H1H1:某一数值,或某一数值,或 某一数值某一数值例如例如,H1:10cm,或或 10
7、cm提出假设提出假设(例题分析例题分析)【例例】一一种种零零件件的的生生产产标标准准是是直直径径应应为为10cm,为为对对生生产产过过程程进进行行控控制制,质质量量监监测测人人员员定定期期对对一一台台加加工工机机床床检检查查,确确定定这这台台机机床床生生产产的的零零件件是是否否符符合合标标准准要要求求。如如果果零零件件的的平平均均直直径径大大于于或或小小于于10cm,则则表表明明生生产产过过程程不不正正常常,必必须须进进行行调调整整。试试陈陈述述用用来来检检验验生产过程是否正常的原假设和备择假设生产过程是否正常的原假设和备择假设解解解解解解:研研研研研研究究究究究究者者者者者者想想想想想想收收
8、收收收收集集集集集集证证证证证证据据据据据据予予予予予予以以以以以以证证证证证证明明明明明明的的的的的的假假假假假假设设设设设设应应应应应应该该该该该该是是是是是是“生生生生生生产产产产产产过过过过过过程程程程程程不不不不不不正正正正正正常常常常常常”。建立的原假设和备择假设为建立的原假设和备择假设为建立的原假设和备择假设为建立的原假设和备择假设为建立的原假设和备择假设为建立的原假设和备择假设为 H HH0 0 0:10cm 10cm 10cm H HH1 1 1:10cm10cm10cm 提出假设提出假设(例题分析例题分析)【例例】某某品品牌牌洗洗涤涤剂剂在在它它的的产产品品说说明明书书中中
9、声声称称:平平均均净净含含量量不不少少于于500克克。从从消消费费者者的的利利益益出出发发,有有关关研研究究人人员员要要通通过过抽抽检检其其中中的的一一批批产产品品来来验验证证该该产产品品制制造造商商的的说说明明是是否否属属实实。试试陈陈述述用用于于检验的原假设与备择假设检验的原假设与备择假设解解解解解解:研研研研研研究究究究究究者者者者者者抽抽抽抽抽抽检检检检检检的的的的的的意意意意意意图图图图图图是是是是是是倾倾倾倾倾倾向向向向向向于于于于于于证证证证证证实实实实实实这这这这这这种种种种种种洗洗洗洗洗洗涤涤涤涤涤涤剂剂剂剂剂剂的的的的的的平平平平平平均均均均均均净净净净净净含含含含含含量量
10、量量量量并并并并并并不不不不不不符符符符符符合合合合合合说说说说说说明明明明明明书书书书书书中中中中中中的的的的的的陈陈陈陈陈陈述述述述述述 。建建建建建建立立立立立立的的的的的的原原原原原原假假假假假假设设设设设设和备择假设为和备择假设为和备择假设为和备择假设为和备择假设为和备择假设为 H H H0 0 0:500 500 500 H H H1 1 1:500 500”或或“”的假设检验,称为单侧检验的假设检验,称为单侧检验或单尾检验或单尾检验(one-tailed test)备择假设的方向为备择假设的方向为“”,称为,称为右侧检验右侧检验 双侧检验与单侧检验双侧检验与单侧检验(假设的形式假
11、设的形式)假假设双双侧检验单侧检验单侧检验左左侧检验右右侧检验原假设原假设H0:=0 0H0:0 0H0:0 0备择假设备择假设H1:0 0H1:0 0假设检验中的两类错误假设检验中的两类错误(决策结果决策结果)H H0 0:无罪无罪无罪无罪陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验决策实际情况H0为真H0为假未拒绝H0正确决策(1 )第类错误()拒绝H0第类错误()正确决策(1-)假设检验就好像一场审判过程假设检验就好像一场审判过程假设检验就好像一场审判过程假设检验就好像一场审判过程统计检验过程统计检验过程统计检验过
12、程统计检验过程假设检验中的两类错误假设检验中的两类错误第第类错误类错误(弃真错误弃真错误)原假设为真时拒绝原假设原假设为真时拒绝原假设第第类错误的概率记为类错误的概率记为 被称为显著性水平被称为显著性水平第第类错误类错误(取伪错误取伪错误)原假设为假时未拒绝原假设原假设为假时未拒绝原假设第第 类类 错错 误误 的的 概概 率率 记记 为为 (Beta)错误和错误和 错误的关系错误的关系 你不能同时减你不能同时减少两类错误少两类错误!和和和和 的关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板,小小小小 就就就就大,大,大,大,大大大大 就小就小就小就小显著性水平显著性水平
13、(significant level)是一个概率值是一个概率值原假设为真时,拒绝原假设的概率原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域被称为抽样分布的拒绝域表示为表示为 (alpha)常用的常用的 值有值有0.01,0.05,0.10由研究者事先确定由研究者事先确定检验统计量检验统计量(test statistic)1.根根据据样样本本观观测测结结果果计计算算得得到到的的,并并据据以以对对原原假假设设和和备备择择假假设设作作出出决决策策的的某某个个样样本本统统计量计量2.对样本估计量的标准化结果对样本估计量的标准化结果原假设原假设H0为真为真点估计量的抽样分布点估计量的抽样分布 3.
14、3.标准化的检验统计量标准化的检验统计量 显著性水平和拒绝域显著性水平和拒绝域(双侧检验双侧检验)0 0 0临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH000拒绝拒绝拒绝H HH0001-1-1-置信水平置信水平置信水平置信水平置信水平置信水平抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布显著性水平和拒绝域显著性水平和拒绝域(双侧检验双侧检验)0 0临界值临界值临界值临界值/2/2/2/2 样本统计量样本统计量样本统计量样本统计量拒绝拒绝拒绝拒绝H H0 0拒绝拒绝拒绝拒绝H H0 0抽样分布抽样分布抽样分布抽样分布1-1-
15、置信水平置信水平置信水平置信水平显著性水平和拒绝域显著性水平和拒绝域(双侧检验双侧检验)0 0临界值临界值临界值临界值/2/2/2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平显著性水平和拒绝域显著性水平和拒绝域(双侧检验双侧检验)0 0临界值临界值临界值临界值/2/2/2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平显著性水平和拒绝域显著性水平和拒绝域(单侧检验单侧检验)0 0临界值临界值 样本统计量样本统计量
16、拒绝拒绝H H0 0抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平显著性水平和拒绝域显著性水平和拒绝域(左侧检验左侧检验)0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量显著性水平和拒绝域显著性水平和拒绝域(左侧检验左侧检验)0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH
17、0 00抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平显著性水平和拒绝域显著性水平和拒绝域(右侧检验右侧检验)0 0临界值临界值 样本统计量样本统计量拒绝拒绝H H0 0抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量显著性水平和拒绝域显著性水平和拒绝域(右侧检验右侧检验)0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平拒绝拒绝拒绝H HH0 00决策规则决策规则1.给定显著性水平给
18、定显著性水平,查表得出相应的临界,查表得出相应的临界值值z 或或z ,t 或或t 2.将检验统计量的值与将检验统计量的值与 水平的临界值进行水平的临界值进行比较比较3.作出决策作出决策双侧检验:双侧检验:|统计量统计量|临界值,拒绝临界值,拒绝H0左侧检验:左侧检验:统计量统计量 临界值,拒绝临界值,拒绝H0 检验步骤检验步骤建立总体假设建立总体假设H0,H11选择统计量选择统计量确定确定H0为真为真时的抽样分布时的抽样分布2确定分布上的临确定分布上的临界点界点C和检验规则和检验规则计算检验统计算检验统计量的数值计量的数值比较并作出检验判断比较并作出检验判断534例题分析例题分析【例例】某厂生
19、产一种供出口的罐头,标准规格某厂生产一种供出口的罐头,标准规格是每罐净重是每罐净重250克。根据以往检验,标准差是克。根据以往检验,标准差是3克。现从生产线上随机抽取克。现从生产线上随机抽取100罐进行检验,罐进行检验,称得其平均净重称得其平均净重251克。问该批罐头是否合乎克。问该批罐头是否合乎规格净重?规格净重?解:Step1:建立零假设和备择假设建立零假设和备择假设例题分析例题分析Step2:确定合适的检验统计量及相应的抽样分布确定合适的检验统计量及相应的抽样分布n=10030是大样本,且标准差为是大样本,且标准差为3已知,所以已知,所以均值服从正态分布,且均值服从正态分布,且Step3
20、:确定决策规则,即确定拒绝域确定决策规则,即确定拒绝域拒绝域为:拒绝域为:例题分析例题分析Step4:计算有关统计量的值计算有关统计量的值Step5:进行统计决策并得出结论进行统计决策并得出结论Z3.331.96.拒绝原假设拒绝原假设结论:结论:在显著水平等于在显著水平等于0.05条件下抽样结条件下抽样结果显著偏高,可认为这批罐头的实际净重果显著偏高,可认为这批罐头的实际净重要高于要高于250克克 利用利用 P 值值 进行决策进行决策什么是什么是P 值值?(P-value)1.在原假设为真的条件下,检验统计量的观察在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率值大于或等于其计
21、算值的概率双侧检验为分布中两侧面积的总和双侧检验为分布中两侧面积的总和2.反映实际观测到的数据与原假设反映实际观测到的数据与原假设H0之间不一之间不一致的程度致的程度3.被称为观察到的被称为观察到的(或实测的或实测的)显著性水平显著性水平4.决策规则:决策规则:若若p值值,拒绝拒绝 H0双侧检验的双侧检验的P 值值 /2 2 /2 2 Z Z拒绝拒绝拒绝拒绝H H0 0拒绝拒绝拒绝拒绝H H0 00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样
22、本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值左侧检验的左侧检验的P 值值0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值右侧检验的右侧检验的P 值值0 0 0临界值临界值临界值 拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1
23、-1-1-置信水平置信水平置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值假设检验结论的表述假设检验结论的表述1.假假设设检检验验的的目目的的就就在在于于试试图图找找到到拒拒绝绝原原假假设设证证据据,而不在于证明什么是正确的而不在于证明什么是正确的2.拒绝原假设时结论是清楚的拒绝原假设时结论是清楚的例如,例如,H0:=10,拒绝拒绝H0时时,我们可以说,我们可以说103.当不拒绝原假设时当不拒绝原假设时并未给出明确的结论并未给出明确的结论不能说原假设是正确的,也不能说它不是正确的不能说
24、原假设是正确的,也不能说它不是正确的例例如如,当当不不拒拒绝绝H0:=10,我我们们并并未未说说它它就就是是10,但但也也未未说说它它不不是是10。我我们们只只能能说说样样本本提提供供的的证证据据还还不不足足以以推翻原假设推翻原假设假设检验步骤的总结假设检验步骤的总结1.陈述原假设和备择假设陈述原假设和备择假设2.确定一个适当的检验统计量确定一个适当的检验统计量3.确确定定一一个个适适当当的的显显著著性性水水平平,并并计计算算出出其其临临界界值,指定拒绝域值,指定拒绝域4.利用样本计算检验统计量的值利用样本计算检验统计量的值5.将统计量的值与临界值进行比较,作出决策将统计量的值与临界值进行比较
25、,作出决策统计量的值落在拒绝域,拒绝统计量的值落在拒绝域,拒绝H0,否则不拒绝否则不拒绝H0也可以直接利用也可以直接利用P值作出决策作出决策一个总体参数的检验一个总体参数的检验总体均值的检验总体均值的检验总体比例的检验总体比例的检验总体方差的检验一个总体参数的检验一个总体参数的检验z 检验检验(单尾和双尾单尾和双尾)t 检验检验(单尾和双尾单尾和双尾)z 检验检验(单尾和双尾单尾和双尾)检验检验(单尾和双尾单尾和双尾)均值均值一个总体一个总体比例比例方差方差总体总体均值的检验均值的检验 是否已是否已知知小小小小小小样本容量样本容量n大大大大大大 是否已是否已知知否否否否否否 t 检验检验否否否
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计 ch6
