应用统计--抽样与抽样分布.ppt
《应用统计--抽样与抽样分布.ppt》由会员分享,可在线阅读,更多相关《应用统计--抽样与抽样分布.ppt(59页珍藏版)》请在沃文网上搜索。
1、应用统计应用统计第四章:抽样与抽样分布第四章:抽样与抽样分布抽样的基本概念抽样的基本概念抽样调查的特点抽样调查的特点经济性经济性时效性时效性必要性必要性抽样所需样本必需要有代表性抽样所需样本必需要有代表性例:例:文学摘要文学摘要杂志的停刊杂志的停刊Gallup(http:/ Literary Digest(文学摘文学摘要要)杂志进行了一次民意调查。调查的焦点是谁将成为下一届总统杂志进行了一次民意调查。调查的焦点是谁将成为下一届总统是挑战者,堪萨斯州州长是挑战者,堪萨斯州州长Alf Landon,还是现任总统还是现任总统 Franklin Delano Roosevelt。为了解选民意向,民意调
2、查专家们根据电话为了解选民意向,民意调查专家们根据电话簿和车辆登记簿上的名单给一大批人发了简单的调查表(电话和汽簿和车辆登记簿上的名单给一大批人发了简单的调查表(电话和汽车在车在1936年并不像现在那样普及,但是这些名单比较容易得到)。年并不像现在那样普及,但是这些名单比较容易得到)。尽管发出的调查表大约有一千万张,但收回的比例并不高。在收回尽管发出的调查表大约有一千万张,但收回的比例并不高。在收回的调查表中,的调查表中,Alf Landon非常受欢迎。于是该杂志预测非常受欢迎。于是该杂志预测 Landon 将赢得选举。但事实上是将赢得选举。但事实上是Franklin Roosevelt赢得了
3、这次选举赢得了这次选举在经济大萧条时期调查有电话和汽车的人们,并不能够反映全体选在经济大萧条时期调查有电话和汽车的人们,并不能够反映全体选民的观点。此外,只有少数的问卷被收回。这些都是值得怀疑的民的观点。此外,只有少数的问卷被收回。这些都是值得怀疑的抽样方法抽样方法简单随机抽样简单随机抽样分层抽样分层抽样整群抽样整群抽样系统抽样系统抽样多阶段抽样多阶段抽样概率抽样概率抽样方便抽样方便抽样判断抽样判断抽样自愿样本自愿样本滚雪球抽样滚雪球抽样配额抽样配额抽样非概率抽样非概率抽样抽样方式抽样方式概率抽样概率抽样1.根根据据一一个个已已知知的的概概率率来来抽抽取取样样本本单单位位,也也称随机抽样称随机
4、抽样.2.特点特点按一定的概率以随机原则抽取样本按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中抽取样本时使每个单位都有一定的机会被抽中每每个个单单位位被被抽抽中中的的概概率率是是已已知知的的,或或是是可可以以计计算出来的算出来的 当当用用样样本本对对总总体体目目标标量量进进行行估估计计时时,要要考考虑虑到到每个样本单位被抽中的概率每个样本单位被抽中的概率简单随机抽样简单随机抽样1.从从总总体体N个个单单位位中中随随机机地地抽抽取取n个个单单位位作作为为样样本本,使使得得每每一一个个容容量量为为n样样本本都都有有相相同同的的机机会会(概概率率)被被抽抽中中 2.抽取元素的
5、具体方法有重复抽样和不重复抽样抽取元素的具体方法有重复抽样和不重复抽样3.特点特点简单、直观,在抽样框完整时,可直接从中抽取样本简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便4.局限性局限性当当N很大时,不易构造抽样框很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率没有利用其他辅助信息以提高估计的效率简单随机抽样简单随机抽样【例】某公司想从某公司想从某公司想从某公司想从800800800800名专职雇员中抽取一个由名专职雇员中抽取一个由名
6、专职雇员中抽取一个由名专职雇员中抽取一个由32323232名专职雇员组成的样本,来获得有关公司发名专职雇员组成的样本,来获得有关公司发名专职雇员组成的样本,来获得有关公司发名专职雇员组成的样本,来获得有关公司发起的护牙计划支出情况的信息。公司认为,并起的护牙计划支出情况的信息。公司认为,并起的护牙计划支出情况的信息。公司认为,并起的护牙计划支出情况的信息。公司认为,并非每个人都愿意回答问卷,因此他们必须寄多非每个人都愿意回答问卷,因此他们必须寄多非每个人都愿意回答问卷,因此他们必须寄多非每个人都愿意回答问卷,因此他们必须寄多于于于于32323232份的问卷才能获得想要的份的问卷才能获得想要的份
7、的问卷才能获得想要的份的问卷才能获得想要的32323232份答案。假设份答案。假设份答案。假设份答案。假设平均每平均每平均每平均每10101010个专职雇员中有个专职雇员中有个专职雇员中有个专职雇员中有8 8 8 8人愿意回答调查问卷人愿意回答调查问卷人愿意回答调查问卷人愿意回答调查问卷(即(即(即(即80808080的回答率),就必须抽取总数为的回答率),就必须抽取总数为的回答率),就必须抽取总数为的回答率),就必须抽取总数为40404040个个个个雇员的样本才能得到想要的雇员的样本才能得到想要的雇员的样本才能得到想要的雇员的样本才能得到想要的32323232份回答。因此,份回答。因此,份回
8、答。因此,份回答。因此,要从公司的个人档案中抽取要从公司的个人档案中抽取要从公司的个人档案中抽取要从公司的个人档案中抽取40404040名专职雇员。在名专职雇员。在名专职雇员。在名专职雇员。在实际工作中,该怎样进行简单随机抽样?实际工作中,该怎样进行简单随机抽样?实际工作中,该怎样进行简单随机抽样?实际工作中,该怎样进行简单随机抽样?系统抽样(等距抽样)1.将将总总体体中中的的所所有有单单位位(抽抽样样单单位位)按按一一定定顺顺序序排排列列,在在规规定定的的范范围围内内随随机机地地抽抽取取一一个个单单位位作作为为初初始始单单位位,然然后后按按事事先先规规定定好好的的规规则则确确定定其其他他样本
9、单位样本单位先先从从数数字字1到到k之之间间随随机机抽抽取取一一个个数数字字r作作为为初初始始单单位位,以后依次取以后依次取r+k,r+2k等单位等单位2.优点:操作简便,可提高估计的精度优点:操作简便,可提高估计的精度3.缺点:对估计量方差的估计比较困难缺点:对估计量方差的估计比较困难4.【例例】续上例续上例分层抽样1.将将总总体体单单位位按按某某种种特特征征或或某某种种规规则则划划分分为为不不同同的的层层(类类),然然后后从从不不同同的的层层中中独独立立、随随机机地地抽取样本抽取样本2.原则:层间差异较大,而层内差异较小原则:层间差异较大,而层内差异较小3.优点优点保保证证样样本本的的结结
10、构构与与总总体体的的结结构构比比较较相相近近,从从而而提提高高估估计的精度计的精度组织实施调查方便组织实施调查方便既既可可以以对对总总体体参参数数进进行行估估计计,也也可可以以对对各各层层的的目目标标量量进行估计进行估计分层抽样分层抽样【例例例例】假设某大学的商学院想对今年的毕业生进行一次假设某大学的商学院想对今年的毕业生进行一次假设某大学的商学院想对今年的毕业生进行一次假设某大学的商学院想对今年的毕业生进行一次调查,以便了解他们的就业倾向。该学院有调查,以便了解他们的就业倾向。该学院有调查,以便了解他们的就业倾向。该学院有调查,以便了解他们的就业倾向。该学院有5 5个专业:个专业:个专业:个
11、专业:会计,金融,市场营销,经营管理,信息系统。今年共会计,金融,市场营销,经营管理,信息系统。今年共会计,金融,市场营销,经营管理,信息系统。今年共会计,金融,市场营销,经营管理,信息系统。今年共有有有有15001500名毕业生,其中会计专业名毕业生,其中会计专业名毕业生,其中会计专业名毕业生,其中会计专业500500名,金融专业名,金融专业名,金融专业名,金融专业350350名,名,名,名,市场营销专业市场营销专业市场营销专业市场营销专业300300名,经营管理专业名,经营管理专业名,经营管理专业名,经营管理专业150150名,信息系统专名,信息系统专名,信息系统专名,信息系统专业业业业2
12、00200名。假定要选取名。假定要选取名。假定要选取名。假定要选取180180人作为样本,各专业应抽取的人作为样本,各专业应抽取的人作为样本,各专业应抽取的人作为样本,各专业应抽取的人数分别为:会计专业人数分别为:会计专业人数分别为:会计专业人数分别为:会计专业6060人,金融专业人,金融专业人,金融专业人,金融专业6262人,市场营销人,市场营销人,市场营销人,市场营销专业专业专业专业3636人,经营管理专业人,经营管理专业人,经营管理专业人,经营管理专业1818人,信息系统人,信息系统人,信息系统人,信息系统2424人。人。人。人。整群整群抽样抽样1.将将总总体体中中若若干干个个单单位位合
13、合并并为为组组(群群),抽抽样样时时直直接接抽抽取取群群,然然后后对对中中选选群群中中的的所所有有单单位位全全部部实实施施调查调查2.原则:群间差异小,群内差异大。原则:群间差异小,群内差异大。3.特点特点抽样时只需群的抽样框,可简化工作量抽样时只需群的抽样框,可简化工作量调调查查的的地地点点相相对对集集中中,节节省省调调查查费费用用,方方便便调调查查的的实实施施缺点是估计的精度较差缺点是估计的精度较差抽样分布理论抽样分布理论 总体参数总体参数总体平均值总体平均值总体方差总体方差总体标准差总体标准差总体比率总体比率抽样分布理论抽样分布理论样本统计量样本统计量样本平均值样本平均值样本方差样本方差
14、样本标准差样本标准差样本比率样本比率三种不同性质的分布三种不同性质的分布总体分布总体分布样本分布样本分布抽样分布抽样分布总体分布总体分布(population distribution)1.1.总体中各元素的观察值所形成的分布总体中各元素的观察值所形成的分布 2.2.分布通常是未知的分布通常是未知的3.3.可以假定它服从某种分布可以假定它服从某种分布 总体总体总体总体样本分布样本分布(sample distribution)1.1.一个样本中各观察值的分布一个样本中各观察值的分布 2.2.也称经验分布也称经验分布 3.3.当样本容量当样本容量n n逐渐增大时,样本分布逐渐逐渐增大时,样本分布逐
15、渐接近总体的分布接近总体的分布 样样本本抽样分布抽样分布(sampling distribution)1.样本统计量的概率分布,样本统计量的概率分布,是一种理论分布是一种理论分布在重复选取容量为在重复选取容量为n的样本时,由该统计量的所有可的样本时,由该统计量的所有可能取值形成的相对频数分布能取值形成的相对频数分布 2.样本统计量样本统计量是随机变量是随机变量样本均值样本均值,样本比例,样本方差等样本比例,样本方差等3.结果来自结果来自容量相同容量相同的的所有所有可能样本可能样本4.提供了样本统计量长远而稳定的信息,是进行提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学
16、性的重要推断的理论基础,也是抽样推断科学性的重要依据依据 抽样分布的形成过程抽样分布的形成过程(sampling distribution)总体总体计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计量量量量量量如:样本均值、如:样本均值、如:样本均值、比例、方差比例、方差比例、方差样样本本一个总体参数推断时样本一个总体参数推断时样本统计量的抽样分布统计量的抽样分布样本均值的抽样分布样本均值的抽样分布1.在重复选取容量为在重复选取容量为n的样本时,由样本均的样本时,由样本均值的所有可能取值形成的相对频数分布值的所有可能取值形成的相对频数分布2.一种理论概率分布一种理论概率分
17、布3.推断总体均值推断总体均值 的理论基础的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)【例例例例】设设设设一一一一个个个个总总总总体体体体,含含含含有有有有4 4个个个个元元元元素素素素(个个个个体体体体),即即即即总总总总体体体体单单单单位位位位数数数数N=N=4 4。4 4 个个个个个个个个体体体体分分分分别别别别为为为为x x1 1=1=1,x x2 2=2=2,x x3 3=3=3,x x4 4=4=4 。总总总总体的均值、方差及分布如下体的均值、方差及分布如下体的均值、方差及分布如下体的均值、方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 3
18、0 0.1.1.2 2.3.3均值和方差均值和方差均值和方差均值和方差样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)计计算算出出各各样样本本的的均均值值,如如下下表表。并并给给出出样样本本均均值的抽样分布值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)x x样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 00.10.10.20.20.30.3P P(x x)1.51.53.03.04.0
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计 抽样 分布