【统计与统计案例-20210407005736x】

时间:2021-10-17 10:42:38  来源:网友投稿

精品文档

精品文档

第九章 统计与统计案例

第一节 随机抽样

考纲要求 : 1.理解随机抽样的必要性和重要性 .2.会用简单随机抽样方法从总体中抽取样本 .3.了解分 层抽样和系统抽样方法.

[ 基础真题体验 ]

考查角度 [抽样方法 ]

(2013课标全国卷I )为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分 学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生 视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是 ( )

A .简单随机抽样 B .按性别分层抽样

C.按学段分层抽样 D .系统抽样

解析】 由于三个学段学生的视力情况差别较大,故需按学段分层抽样.

【答案】 C

(2014四川高考)在“世界读书日”前夕,为了了解某地 5 000名居民某天的阅读时间,从中抽取 了 200名居民的阅读时间进行统计分析.在这个问题中, 5 000名居民的阅读时间的全体是( )

A .总体 B .个体

C.样本的容量 D .从总体中抽取的一个样本

【解析】 调查的目的是“了解某地5 000名居民某天的阅读时间”,所以“ 5 000名居民的阅读时

间的全体”是调查的总体.

【答案】 A

(2014天津高考)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的

方法,从该校四个年级的本科生中抽取一个容量为 300的样本进行调查,已知该校一年级、二年级、三

年级、四年级的本科生人数之比为 4 : 5 : 5 : 6,则应从一年级本科生中抽取 学生.

【解析】 根据题意,应从一年级本科生中抽取的人数为 4 X 300= 60.

4+ 5+ 5+ 6

【答案】 60

[命题规律预测]

命题规律

从近几年的咼考试题看,对本节内容的考查主要体现在以下两点:

1?主要考查随机抽样的方法及其计算.

2?题型以选择题和填空题为主,属于中低档题.

考向预测预测2016年高考将以分层抽样为切入点,结合实际生活背景,考查分层 抽样的概念及相关计算.

考向预测

考向一简单随机抽样

[典例剖析

【例1】(2013江西高考)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表 选取5个个体,选取方法是从随机数表第 1行的第5列和第6列数字开始由左到右依次选取两个数字, 则选出来的第5个个体的编号为( )

7816

6572

0802

6314

0702

4369

9728

0198

3204

9234

4935

8200

3623

4869

6938

7481

A.08 B . 07 C. 02 D. 01

【思路点拨】 读数t比较与20的大小t选数t成样

【解析】 由随机数表法的随机抽样的过程可知选出的 5个个体是08,02,14,07,01,所以第5个个体

的编号是01.

【答案】 D

抽签法与随机数表法的适用情况: (1)抽签法适用于总体中个体数较少的情况,随机数表法适用于总体中个体数较多的情况.

(2)一个抽样试验能否用抽签法,关键看两点:

一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.

[对点练习]

下列抽样方法是简单随机抽样的是 ( )

A .从50个零件中一次性抽取5个做质量检验

B .从50个零件中有放回地抽取5个做质量检验

从实数集中逐个抽取10个正整数分析奇偶性

运动员从8个跑道中随机抽取一个跑道

【解析】 简单随机抽样是不放回、逐个、等可能的抽样,故 D 正确.

【答案】 D

考向二系统抽样及其应用

[典例剖析]

【例2】(1)(2013陕西高考)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将 840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )

11 B. 12 C. 13 D. 14

⑵采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为 1,2,…,960,分 组后在第一组采用简单随机抽样的方法抽到的号码为 9抽到的32人中,编号落入区间[1,450]的人做问 卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为( )

A . 7 B. 9 C. 10 D. 15

【思路点拨】 (1)结合系统抽样的方法及不等式解法求解.

(2)结合系统抽样及等差数列知识求解.

【解析】(1)抽样间隔为840= 20?设在1,2,…,20中抽取号码X0(X0 € [1,20]),在[481,720]之间抽

取的号码记为 20k + xo,贝S 481< 20k+ x°w 720, k€ N*.

二 2420< k+ 20< 36.

2x0€ 2o, 1,二 k= 24,25,26,…,35,

k值共有35-24 + 1= 12(个),即所求人数为12.

(2)由系统抽样的特点知:抽取号码的间隔为 960= 30,抽取的号码依次为9,39,69,…939落入区间 [451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n项,显然有 729= 459+ (n- 1)x 30,解得n= 10所以做问卷B的有10人.

【答案】(1)B (2)C

系统抽样的特点:

适用于元素个数很多且均衡的总体.

各个个体被抽到的机会均等.

⑶总体分组后,在起始部分抽样时采用的是简单随机抽样.

⑷如果总体容量N能被样本容量n整除,则抽样间隔为k= N.

提醒:如果总体容量N不能被样本容量n整除,可随机地从总体中剔除余数,然后再按系统抽样的 方法抽样.

[对点练习]

高三(1)班共有56人,学号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容量为 4的样本.已

知学号为 6,34,48的同学在样本中,那么还有一个同学的学号应为

()

A . 30 B. 25 C. 20 D. 15

【解析】 由题意可知,可将学号依次为1,2,3,…,56的56名同学分成4组,每组14人,抽取

的样本中,若将他们的学号按从小到大的顺序排列,彼此之间会相差 14,故还有一个同学的学号应为

14+ 6 = 20.

【答案】 C

考向三 分层抽样及其应用

[典例剖析 ]

【例3】(2013湖南高考)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为 120件,80 件, 60 件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为 n 的样本进行 调查,其中从丙车间的产品中抽取了 3件,则 n=( )

B . 10C

B . 10

C. 12

D. 13

(2)(2014湖北高考)甲、乙两套设备生产的同类型产品共 4 800件,采用分层抽样的方法从中抽取一

个容量为80的样本进行质量检测.若样本中有 50件产品由甲设备生产,则乙设备生产的产品总数为

件.

【思路点拨】利用“抽样比=样本容量_

【思路点拨】

利用“抽样比=

样本容量_各层样本容量”

总体容量—各层个体数量

求解(1)(2).

【解析】⑴依题意得盘=120+;0 + 60'故n= 13.

(2)设乙设备生产的产品总数为x件,则甲设备生产的产品总数为(4 800-x)件.由分层抽样特点,

结合题意可得5q= 4 800 '解得x= 1 800.

【答案】(1)D (2)1 800

与分层抽样有关问题的常见类型及解题策略:

确定抽样比.可依据各层总数与样本数之比’确定抽样比.

求某一层的样本数或总体个数.可依据题意求出抽样比’再由某层总体个数 (或样本数)确定该层

的样本(或总体)数.

⑶求各层的样本数.可依据题意’求出各层的抽样比’再求出各层样本数.

[对点练习]

某校共有学生2 000名’各年级男、女生人数如下表.已知在全校学生中随机抽取 1名’抽到二

年级女生的概率是0.19,现用分层抽样的方法在全校抽取 64名学生,则应在三年级抽取的学生人数为

()

一年级

二年级

三年级

女生

373

x

y

男生

377

370

z

24 B. 18 C. 16 D. 12

【解析】 根据题意可知二年级女生的人数应为 2 000X 0.19= 380(人),故一年级共有人数750人,

750

二年级共有750人,这两个年级均应抽取64X 2000= 24(人),则应在三年级抽取的学生人数为 64- 24X 2

=16(人).【答案】 C

误区分析17忽视“抽样比”相等导致分层抽样失误

96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人A. 101

96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为

12,21,25,43,

则这四个社区驾驶员的总人

A. 101

B. 808

C. 1 212

D. 2 012

[典例剖析]

【典例】(2015洛阳模拟)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,

N,

N,其中甲社区有驾驶员

【解析】 四个社区共抽取了 12+ 21 + 25 + 43= 101人.

12

又由题意可知抽样比为96,

故 96=101

此处在求解时,因不理解“总本容量=抽样比”致误

解得N= 808.

【答案】 B

【防范措施】 1?对于分层抽样问题,其解决的关键是抓住

【防范措施】 1?对于分层抽样问题,其解决的关键是抓住

“样本容量

总体容量=抽样比”建立等量关系.

2.等可能性入样是所有简单随机抽样的大前提.

[对点练习]

某工厂的一、二、三车间在 12 月份共生产了 3 600双皮靴,在出厂前要检查这批产品的质量,决 定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为 a、b、c,且a、b、c构成

等差数列,则二车间生产的产品数为 ( )

A.800 B.1 000 C.1 200 D.1 500

【解析】 设该厂的一、二、三车间生产的产品数分别为 x, y, z,由题意可知x: y : z= a : b : c,

又a, b, c成等差数列,所以2b= a + c,

即 2y= x+ z.

又 x+y+z= 3 600,— 3y= 3 600, y= 1 200.

【答案】 C

课堂达标训练

(2013湖南高考)某学校有男、女学生各 500名,为了解男、女学生在学习兴趣与业余爱好方面 是否存在显著差异,拟从全体学生中抽取 100名学生进行调查,则宜采用的抽样方法是 ( )

A .抽签法 B .随机数法

C.系统抽样法 D .分层抽样法

【解析】 由于是调查男、 女学生在学习兴趣与业余爱好方面是否存在差异, 因此用分层抽样方法.

【答案】 D

.从30个个体中抽取10个样本,现给出某随机数表的第11行到第15行(见下表),如果某人选取

第12行的第6列和第7列中的数作为第一个数并且由此数向右读, 则选取的前4个的号码分别为( )

9264 4607 2021 3920 7766 3817 3256 1640

5858 7766 3170 0500 2593 0545 5370 7814

2889 6628 6757 8231 1589 0062 0047 3815

5131 8186 3709 4521 6665 5325 5383 2702

9055 7196 2172 3207 1114 1384 4359 4488

A . 76,63,17,00 B. 16,00,02,30

C. 17,00,02,25 D. 17,00,02,07

【解析】 在随机数表中,将处于00?29的号码选出,第一个数76不合要求,第2个63不合要

求,满足要求的前4个号码为17,00,02,07.

【答案】 D

.从2 014名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样法从 2 014

名学生中剔除14名学生,再用系统抽样法从剩下的 2 000名学生中选取50名学生.则每人入选的概率

()

A .不全相等 B .均不相等

25 1

c.都相等,且为7007 d.都相等,且为40

【解析】 抽样过程中每个个体被抽取的机会均等,概率相等,故每人入选的概率为

50 25

2 014= 1 007

故选C.

【答案】 C

某学校高一、高二、高三年级的学生人数之比为 3 : 3: 4,现用分层抽样的方法从该校高中三个

年级的学生中抽取容量为50的样本,则应从高二年级抽取 学生.

【解析】 由分层抽样的特征可知,应从高二年级抽取 3^105°= 15.

【答案】15

课时提升练(五十二)随机抽样

一、选择题

(2014广东高考)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为 40的 样本,则分段的间隔为()

A . 50 B. 40 C. 25 D. 20

【解析】 根据系统抽样的特点可知分段间隔为1400= 25,故选C.

【答案】 C

(2014重庆高考)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽

样的方法从该校学生中抽取一个容量为 n的样本,已知从高中生中抽取 70人,则n为( )

A . 100 B. 150 C. 200 D. 250

【解析】 法一:由题意可得了0^二3500解得n= 100,故选A.

n— 70 1 500

TOC \o "1-5" \h \z 70 1 1

法二:由题意,抽样比为3~500= 50,总体容量为3 500 + 1 500= 5 000,故n= 5 000X 55= 100.

【答案】 A

3. (2014石家庄模拟)某学校在高三年级一班共有60名学生,现采用系统抽样的方法从中抽取 6名 学生做“早餐与健康”的调查,为此将学生编号为 1,2,…,60?选取的这6名学生的编号可能是( )

A . 1,2,3,4,5,6 B. 6,16,26,36,46,56

C. 1,2,4,8,16,32 D. 3,9,13,27,36,54

【解析】 系统抽样是等间隔抽样.

【答案】 B

.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的 2 倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工 32人,则该样

本中的老年职工人数为()

A . 9 B. 18 C. 27 D. 36

【解析】 设该单位老年职工有x人,从中抽取y人.

则160 + 3x= 430? x= 90,即老年职工有90人,

即鴛=32? y=18.

【答案】 B

将参加夏令营的600名学生编号为:001,002,…,600?采用系统抽样方法抽取一个容量为 50的

样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第I营区,从301到495 在第H营区,从496到600在第皿营区,则三个营区被抽中的人数依次为 ()

A . 26,16,8 B. 25,17,8

C. 25,16,9 D . 24,17,9

【解析】 由题意知,间隔k=600= 12,故抽到的个体编号为12k + 3(其中k= 0,1,2,3,…,49).令

12k + 3< 300,解得 k< 24.

k= 0,1,2,…,24,共 25 个编号.

所以从I营区抽取25人;

令 300v 12k+ 3< 495,解得 25< k<41

二 k= 25,26,27,…,41,共 17 个编号.

所以从H营区抽取17人;

因此从第皿营区抽取50-25- 17= 8(人).

【答案】 B

6 .某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10 人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽 样时,将学生按一、二、三年级依次统一编号为 1,2,…,270,使用系统抽样时,将学生统一随机编号

为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:

7,34,61,88,115,142,169,196,223,250

5,9,100,107,111,121,180,195,200,265

11,38,65,92,119,146,173,200,227,254 ④30,57,84,111,138,165,192,219,246,270

关于上述样本的下列结论中,正确的是 ( )

A .②、③都不能为系统抽样

B .②、④都不能为分层抽样

C.①、④都可能为系统抽样

D .①、③都可能为分层抽样

【解析】 因为③为系统抽样,所以选项 A不对;因为②为分层抽样,所以选项 B不对;因为④不

为系统抽样,所以选项 C 不对,故选 D.

【答案】 D

二、填空题

(2014汉中模拟)用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从 1?160编号,按编号顺序平均分成20组(1?8号,9?16号,…,153?160号),若第16组抽出的号码 为 126,则第 1 组中用抽签的方法确定的号码是 .

【解析】 设第1组抽取的号码为b,则第n组抽取的号码为8(n—1) + b,

二8X (16— 1) + b= 126,二b= 6,故第1组抽取的号码为6.

【答案】 6

某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有 40种、10种、30

种、20种,现从中抽取一个容量为20的样本进行食品安全检验.若采用分层抽样的方法抽取样本,则 抽取的植物油类与果蔬类食品种类之和是 .

20 1

【解析】 T四类食品的每一种被抽到的概率为 卷=1,二植物油类和果蔬类食品被抽到的种数之

1 和为(10 + 20) X 5 = 6.

【答案】 6

某单位200名职工的年龄分布情况如图9-1-1所示,现要从中抽取40名职工作样本,用系统抽 样法将全体职工随机按1?200编号,并按编号顺序平均分为 40组(1?5号,6?10号,…,196?200 号).若第5组抽出的号码为22,则第8组抽出的号码应是 .若用分层抽样方法,则40岁以下

年龄段应抽取 .

图 9-1-1

【解析】 由分组可知,抽号的间隔为5,

又因为第5组抽出的号码为22,

所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.

40岁以下的年龄段的职工数为 200X 0.5= 100,

则应抽取的人数为200x 100= 20(人).

【答案】 37 20

三、解答题

中央电视台为了解观众对 《中国好歌曲》的意见,准备从502名现场观众中抽取10%进行座谈, 请用系统抽样的方法完成这一抽样.

【解】 把502名观众平均分成50组,由于502除以50的商是10,余数是2,所以每组有10名 观众,还剩2名观众,采用系统抽样的方法抽样的步骤如下:

第一步,先用简单随机抽样的方法从 502名观众中抽取2名观众,这2名观众不参加座谈;

第二步,将剩下的500名观众编号为1,2,3,…,500,并均匀分成50段,每段含 詈二10个个体;

第三步,从第1段即1,2,…,10这10个编号中,用简单随机抽样的方法抽取一个编号(比如I)作为 起始编号;

第四步,从I开始,再将编号为I + 10, I + 20, I + 30,…,I + 490的个体抽出,得到一个容量为50 的样本.

某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度 (学历)的调查,其结果(人数 分布)如下表:

学历

35岁以下

35?50岁

50岁以上

本科

80

30

20

研究生

x

20

y

用分层抽样的方法在35?50岁年龄段的专业技术人员中抽取一个容量为 5的样本,将该样本看

成一个总体,从中任取2人,求至少有1人学历为研究生的概率;

在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取 N个人,其中35岁以下48人,

5

50岁以上10人,再从这N个人中随机抽取1人,此人的年龄为50岁以上的概率为39,求x, y的值.

【解】(1)用分层抽样的方法在35?50岁年龄段的专业技术人员中抽取一个容量为 5的样本,设

抽取学历为本科的人数为m」30 = m,解得m= 3.

抽取的样本中有研究生2人,本科生3人,分别记作S1, S2; B1, B2, B3.

从中任取2人的所有等可能基本事件共有10个:(S1, B1), (S1, B2), (S,, B3), (S2, BJ, (S2, B2),

(S2, B3), (S1, S2), (B1, B2), (B1 , B3) , (B2 ,划,

其中至少有1人的学历为研究生的基本事件有 7个:(S, , B” , (S1 , B2) , (S1 , B3) , (S2 , B” , (S> ,

B2) , (S, B3) , (S , S2).

从中任取2人,至少有1人学历为研究生的概率为

z

10.

10 5

⑵由题意,得N = 39,解得N = 78.

? 35?50岁中被抽取的人数为 78-48- 10= 20 ,

48 = 20= 10

80 + x= 50= 20+ y

,解得x

40 , y= 5.

即x, y的值分别为40,5.

某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在 参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数

1

的1,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本 次活动的满意程度,现用分层抽样方法从参加活动的全体职工中抽取一个容量为 200的样本.试确定:

(1) 游泳组中,青年人、中年人、老年人分别所占的比例;

(2) 游泳组中,青年人、中年人、老年人分别应抽取的人数.

【解】(1)设登山组人数为x,游泳组中青年人、中年人、老年人各占比例分别为 a、b、c,则有

x 40% + 3xb

x 40% + 3xb

4x

47.5%,

x 10%+ 3xc

4x =

10%,

解得 b= 50%, c = 10%,则 a = 40%,

即游泳组中,青年人、中年人、老年人各占比例分别为 40%、50%、10%.

(2)游泳组中

3

抽取的青年人数为200X 4X 40%= 60(人);

3

抽取的中年人数为 200X4X 50%= 75(人);

3

抽取的老年人数为 200X4X 10%= 15(人).

第二节 用样本估计总体

考纲要求 : 1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、 茎叶图,理解它们各自的特点 .2.理解样本数据标准差的意义和作用,会计算数据标准差 .3.能从样本数据

中提取基本的数字特征 ( 如平均数、标准差 ),并给出合理的解释 .4.会用样本的频率分布估计总体分布, 会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想 .5.会用随机抽样的基本

方法和样本估计总体的思想解决一些简单的实际问题.

[ 基础真题体验 ]

考查角度 [样本数据的数字特征 ]

(2012山东高考)在某次测量中得到的 A样本数据如下:82,84,84,86,86,86,88,88,88,88若B样本数 据恰好是A样本数据每个都加2后所得数据.则A, B两样本的下列数字特征对应相同的是()

A .众数 B .平均数

C.中位数 D .标准差

【解析】 对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、 平均数都发生改变.

【答案】 D

考查角度 [茎叶图 ]

(2013课标全国卷I )为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取

记录他们日平均增加的睡眠20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后, 时间(单位:h).试验的观测结果如下:

记录他们日平均增加的睡眠

服用A药的20位患者日平均增加的睡眠时间:

0. 6

1.2

2.7

1.5

2.8

1.8

2.2

2.3

3.2

3. 5

2.5

2.6

1.2

2.7

1.5

2.9

3.0

3.1

2. 3

2.4

服用B药的20位患者日平均增加的睡眠时间

3. 2

1.7

1.9

0.8

0.9

2.4

1.2

2.6

1.3

1. 4

1.6

0.5

1.8

0.6

2.1

1.1

2.5

1.2

2. 7

0.5

分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?

根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?

A药

B药

0.

L

2.

3.

图 9-2-1

【解】(1)设A药观测数据的平均数为x,B药观测数据的平均数为y .

由观测结果可得

1

x = 2q(0.6 + 1.2 + 1.2 + 1.5 + 1.5 + 1.8 + 2.2 + 2.3 + 2.3 + 2.4 + 2.5 + 2.6 + 2.7 + 2.7 + 2.8 + 2.9 + 3.0 + 3.1 + 3.2 + 3.5)= 2.3,

一 1

y = 20(0.5 + 0.5 + 0.6 + 0.8 + 0.9 + 1.1 + 1.2 + 1.2 + 1.3 + 1.4 + 1.6 + 1.7 + 1.8 + 1.9 + 2.1 + 2.4 + 2.5 + 2.6 + 2.7 + 3.2)= 1.6.

由以上计算结果可得x >7,因此可看出A药的疗效更好.

(2)由观测结果可绘制茎叶图如图:

A药

1 R药

6

0.

5 5 6 R 9

R 3 5 2 2

1.

1223^67^9

92.

1 5 fl 7

5 2 10

2

从以上茎叶图可以看出,A药疗效的试验结果有10的叶集中在茎2.”,3.”上,而B药疗效的试验结 果有的叶集中在茎0.” 1.”上,由此可看出A药的疗效更好.

考查角度[频率分布直方图]

(2014课标全国卷I )从某企业生产的某种产品中抽取 100件,测量这些产品的一项质量指标值, 由测量结果得如下频数分布表:

质量指标值分

[75,85)

[85,95)

[95,105)

[105,115)

[115,125)

频数

6

26

38

22

8

(1)作出这些数据的频率分布直方图;

(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);

⑶根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于 95的产品至

少要占全部产品80%”的规定?

【解】(1)

⑵质量指标值的样本平均数为 x = 80 X 0.06 + 90 X 0.26+ 100X 0.38 + 110X0.22 + 120X 0.08= 100. 质量指标值的样本方差为 s2= (-20)2X 0.06+ (— 10)2 X 0.26 + 0X 0.38+ 102 X 0.22 + 202 X 0.08= 104. 所以这种产品质量指标值的平均数的估计值为 100,方差的估计值为104.

⑶质量指标值不低于95的产品所占比例的估计值为 0.38+ 0.22 + 0.08= 0.68.

由于该估计值小于0.8,故不能认为该企业生产的这种产品符合 “质量指标值不低于95的产品至少 要占全部产品80%”的规定.

[命题规律预测]

命题规律

从近几年的咼考试题看,对本节内谷的考查体现在以两个方面:

1?频率分布直方图、茎叶图、平均数、方差是高考的热点.

2?题型以解答题为主,常以现实生活为背景与概率等知识结合命题,难度 中等偏下.

考向预测

预测2016年高考将以生活中的实际为载体,考查学生借助统计图表、样 本数据的数字特征及概率知识解决实际问题的能力 .

考向一 频率分布直方图及其应用

[典例剖析]

【例1】(2012广东高考)某校100名学生期中考试语文成绩的频率分布直方图如图 9-2-2所示,其

中成绩分组区间是:[50,60), [60,70), [70,80), [80,90), [90,100].

(1) 求图中a的值;

(2) 根据频率分布直方图,估计这100名学生语文成绩的平均分;

(3) 若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示, 求数学成绩在[50,90)之外的人数.

分数段

[50,60)

[60,70)

[70,80)

[80,90)

x : y

1 : 1

2 : 1

3 : 4

4 : 5

【思路点拨】 (1)直方图中各个矩形的面积代表了频率,所以各个矩形面积之和为 1,可求出a的 值;(2)语文成绩的平均分采取每个小矩形的面积乘以矩形底边中点横坐标之和来求得; (3)先求出各段中

语文成绩人数,再由比例求出各段中的数学成绩人数.

【解】 (1)由频率分布直方图知:(2a + 0.02+ 0.03+ 0.04)x 10= 1,解得a= 0.005.

由频率分布直方图知:这 100名学生语文成绩的平均分为 55X 0.005X 10 + 65x 0.04X 10 +

75X 0.03X 10+ 85x 0.02X 10+ 95x 0.005X 10= 73(分).

由频率分布直方图知:语文成绩在 [50,60), [60,70), [70,80), [80,90)各分数段的人数依次为

0.005X 10X 100= 5,0.04x 10 x 100= 40,0.03x 10x 100= 30,0.02x 10x 100= 20.

14 5

由题中给出的比例关系知数学成绩在上述各分数段的人数依次为 5,40x-= 20,30x 3 = 40,20x 4 =

25.

故数学成绩在[50,90)之外的人数为100- (5+20+40+ 25)= 10.

频率

频率分布直方图中横坐标表示组距, 纵坐标表示频率二组距

频率比

频率分布直方图中各小长方形的面积 之和为1,因此在频率分布直方图中组 距是一个固定值,所以各小长方形高的 比也就是频率比

众数

中位数

最高矩形中点的横坐标

平分频率分布直方图面积且垂直于横轴的 「直线与横轴交点的横坐标

平均数

频率分布直方图中每个小矩形的面积乘以 小矩形底边中点的横坐标

[对点练习]

(2014江苏高考)为了了解一片经济林的生长情况,随机抽测了其中 60株树木的底部周长(单位:

cm),所得数据均在区间[80,130]上,其频率分布直方图如图 9-2-3所示,则在抽测的60株树木中,有

树木的底部周长小于100 cm.

【解析】 底部周长在[80,90)的频率为0.015X 10= 0.15,底部周长在[90,100)的频率为0.025X10 =

0.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15 + 0.25)X 60= 24.

【答案】 24

考向二茎叶图的绘制及应用

[ 典例剖析 ]

【例2】 某良种培育基地正在培育一种小麦新品种 A,将其与原有的一个优良品种 B进行对照

验.两种小麦各种植了 25 亩,所得亩产数据 (单位:千克 )如下:

品种 A: 357,359,367,368,375,388,392,399,400,40,5

412,414,415,421,423,423,427,430,430,43,4

443,445,445,451,454

品种 B: 363,371,374,383,385,386,391,392,394,39,4

395,397,397,400,401,401,403,406,407,41,0

412,415,416,422,430

完成数据的茎叶图.

用茎叶图处理现有的数据,有什么优点?

通过观察茎叶图,对品种 A 与 B 的亩产量及其稳定性进行比较,写出统计结论.

【思路点拨】 由百位数和十位数作茎,以个位数作叶,画出茎叶图,并依据数据的集中程度分析

品种 A 与 B 亩产量及其稳定性的差异.

【解】 (1) 如图所示:

A

B

9 7

35

8 7

36

3

5

37

1 4

a

38

3 5 6

9 2

39

1 2 4 4 5 7 7

5 0

40

0 113 6 7

5 4 2

41

0 2 5 6

7 3 3 1

42

2

4 0 0

43

0

5 5 3

44

4 1

45

(2)由于每个品种的数据都只有 25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰、明了地 展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.

⑶通过观察茎叶图可以看出:①品种 A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差 (或方差)比品种B大,故品种A的亩产稳定性较差.

茎叶图的制作及应用:

茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.

茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进 一步估计总体情况.

制作茎叶图的一般方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同 者共用一个茎,茎按从小到大顺序由上到下列出.

[对点练习]

(2014岳阳模拟)甲、乙两位歌手在“中国好声音”选拔赛中,5次得分情况如图9-2-4所示.记甲、

乙两人的平均得分分别为x甲、x乙,贝y下列判断正确的是( )

6 7

7

5

8

8

8 6 8

4 0

9

3

图 9-2-4

x甲v x乙,甲比乙成绩稳定

x甲v x乙,乙比甲成绩稳定

x甲> x乙,甲比乙成绩稳定

x甲〉x乙,乙比甲成绩稳定

【解析】- 76

【解析】

- 76+77+88+90+ 94

x甲=

85,

x 乙=75+88+86+88+93= 86,

i

s甲 =耳(76 - 85)2 + (77 - 85)2 + (88 - 85)2 + (90 - 85)2 + (94 - 85)2] = 52,

1 s乙 =耳(75 - 86)2 + (88 - 86)2 + (86 - 86)2 + (88 - 86)2 + (93- 86)2] = 35.6.

所以x甲V x乙,瞬> S乙,故乙比甲成绩稳定.

TOC \o "1-5" \h \z 【答案】 B

考向三 数字特征的总体估计

[典例剖析]

【例3】(理)(1)(2014陕西高考)设样本数据xi, X2,…,xio的均值和方差分别为1和4,若y =务

+ a(a为非零常数,i= 1,2,…,10),则yi, y2,…,yio的均值和方差分别为( )

A. 1 + a,4 B. 1 + a,4 + a

C. 1,4 D. 1,4 + a

(2)(2012安徽高考)甲、乙两人在一次射击比赛中各射靶 5次,两人成绩的条形统计图如图 9-2-5

所示,则()

J

邂数 J

|频数

3

L 3

2

2

r I

1

■■III 1

11 |

0

(3456789 10 环数 0

1^3456789 10 环数

图 9-2-5

A .甲的成绩的平均数小于乙的成绩的平均数

B .甲的成绩的中位数等于乙的成绩的中位数

C.甲的成绩的方差小于乙的成绩的方差

D .甲的成绩的极差小于乙的成绩的极差

【思路点拨】 (1)由样本数据数字特征的性质求解;

由频数条 形图读数根据平均数、中位数=方差、 极差的定义求解【解析】10=1,

由频数条 形图读数

根据平均数、中位数=方差、 极差的定义求解

【解析】

10

=1,

y = Xi + a,所以

yi, y2,

…,yio的均值为1+a,方差不变仍为

故选A.

(2)由条形统计图知:

甲射靶5次的成绩分别为:4,5,6,7,8;

乙射靶5次的成绩分别为:5,5,5,6,9,

所以x甲4+5

所以x甲

4+5+6+7+8

5

=6;

- 5+5+5+6+9

x乙=

6.

所以x甲=x 乙.故A不正确.

甲的成绩的中位数为6,乙的成绩的中位数为5,故B不正确.

1 1 1 矗=耳(4 - 6)2 + (5- 6)2 + (6 - 6)2 + (7- 6)2 + (8- 6)2] = &X 10= 2, si =耳(5 — 6)2 + (5- 6)2 + (5- 6)2 +

1 12 12

(6-6)2 + (9- 6)2] = &X 12=5,因为2<5,所以s甲<s乙.故C正确.甲的成绩的极差为:8-4 = 4,乙的 成绩的极差为:9-5=4,故D不正确.故选C.

【答案】(1)A ⑵C

数字特征的意义

平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实 际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.

方差的简化计算公式

1 1

s2 = n【(x2 + x2+…+ xn)-n x2],或写成s2=n(x1 + x2+…+ xn)- x2,即方差等于原数据平方的平均数

减去平均数的平方.

[对点练习]

(2013山东高考)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分

为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以 x表示:

TOC \o "1-5" \h \z 7 7

4 0 1 0 x 9 1

图 9-2- 13

则7个剩余分数的方差为()

116 ,36 “ 6/7

A.p B.〒 C. 36 D. 7

【解析】 根据茎叶图,去掉1个最低分87,1个最高分99,

则 7[87 +94+ 90 + 91 + 90 + (90 + x)+ 91] = 91,

x= 4.

1 36

二 s2= 7【(87 — 91)2 + (94 — 91)2 + (90 — 91)2 + (91 - 91)2 + (90 — 91)2 + (94 — 91)2 + (91 - 91)2]

【答案】 B

满分指导17应用频率直方图对总体作出估计

[典例剖析]

【典例】(12分)(2014贵州适应性练习)某学校随机抽取部分新生调查其上学所需时间 (单位:分

钟),并将所得数据绘制成频率分布直方图(如图9-2-6),其中,上学所需时间的范围是[0,100],样本数据

分组为[0,20),[20,40),[40,60),[60,80),[80,100].

(1) 求直方图中x的值;

(2) 如果上学所需时间不少于1小时的学生可申请在学校住宿,若该学校有 600名新生,请估计新生 中有多少名学生可以申请住宿;

(3)由频率分布直方图估计该校新生上学所需时间的平均值.

【审题指导】

信息提取

破题技巧

(1)

频率分布直方图已知

频率分布直方图中,每个矩形的面积恰好是该组的

频率,各个小矩形的面积之和等于 1

(2)

大于等于1小时的频率可求, 学校总人数已知

计算出新生上学所需时间不少于1小时的频率,乘 以600即得结果.

(3)

频率分布直方图已知

平均数的估计值等于频率分布直方图中每个小矩形 的面积乘以小矩形底边中点的横坐标之和.

【规范解答】 (1 )由直方图可得:20x x+ 0.025X 20+ 0.006 5X 20+ 0.003X 2X 20= 1.所以 x= 0.012

5.3分

新生上学所需时间不少于1小时的频率为0.003X 2X 20= 0.12.5分

因为600x 0.12= 72,所以600名新生中有72名学生可以申请住宿.7分

由题可知

0. 012 5X 20x 10+ 0.025X 20x 30+ 0.006 5x 20x 50+ 0.003X 20x 70+ 0.003X 20x 90

=20x (0.012 5x 10+ 0.025x 30 + 0.006 5x 50 + 0.003x 70 + 0.003x 90)= 33.6 分钟.

故该校新生上学所需时间的平均值为 33.6分钟.12分

【名师寄语】 (1)本题的难点是对频率分布直方图意义的理解以及应用这个图提供的数据对所提

问题的计算.

(2)此类题的常见易错点是频率分布直方图中纵轴上的数据是频率除以组距,而非频率.

[对点练习]

300合肥市2013年11月份空气质量指数趋势■ 257-240112 :95^120I II I1〕 I r;:173:;259

300

合肥市2013年11月份空气质量指数趋势

■ 257-

240

112 :

95

^120

I I

I I

1〕 I r

;:173:

;259: ' *

[::65

I I I

I 1 I

I I I I I 鮎

1871 ? I I 山

*144441

T

08

98:(

I I z I

J :111;

I I

T— n

°0102030405060708091011121314151617181920212223 24252627282930

图 9-2-7

AQI指数

天数

(60,120]

(120,180]

(180,240]

(240,300]

(1)请根据以上趋势图,完成表1并根据表1画出频率分布直方图;

⑵试根据频率分布直方图估计合肥市11月份AQI指数的平均值.

【解】(1)

课堂达标训练

从一堆苹果中任取10只,称得它们的质量如下(单位:克):

125,120,122,105,130,114,116,95,120,134.

TOC \o "1-5" \h \z 则样本数据落在[114.5,124.5)内的频率为( )

A . 0.2 B. 0.3 C. 0.4 D. 0.5

_ _ 4

【解析】 样本数据落在[114.5,124.5]内的共有4个,故其频率为 五=0.4.

【答案】 C

分组为[96,98),(2015江苏启东中学模拟)如图9-2-8为某个容量为

分组为[96,98),

频率/组距[98,100), [100,102), [102,104), [104,106],则在区间[98,100)上的数据的频数为( )

频率/组距

0.150

0J25

O.KM)

0.075

样本数据0,050

样本数据

0 96 98 100 102 104106

图 9-2-8

A. 0.1

0.2

20

D . 10

【解析】 由频率直方图可知0.1 X (100— 98) X 100 = 20.

【答案】 C

(2012陕西高考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图 (如图9-2-9

所示),则该样本的中位数、众数、极差分别是()

1

2 5

2

0 2 3 3

3

124489

45

0011479

6

1 7 8

图 9-2-9

B. 46,45,53D

B. 46,45,53

D. 45,47,53

C. 47,45,56

【解析】由题意知各数为12,15,20,22,23,23,31,32,34,34,

38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68中位数是 46,众数是 45,最大数为 68,最 小数为12,极差为68— 12= 56.

【答案】 A

如图9-2-10是I,H两组各7名同学体重(单位:kg)数据的茎叶图.设I,H两组数据的平均数

依次为x 1和x 2,标准差依次为Si和S,那么( )

[组

II组

3 6 7 8

5

4 6 8

1

6

0 1

0 2

7

2 3

图 9-2-10

A. x i > x 2, Si > S2C. x i

A. x i > x 2, Si > S2

C. x i< x 2, Si>S2

D. x 1 v x 2, Si v S2

【解析】由题意可得x i = 6i

【解析】

由题意可得x i = 6i,

x 2 = 62, Si =

3i6

7 , S2 =

3;2,故选D.

【答案】 D

6组:(20i3福建高考)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成 [40,50), [50,60), [60,70)[70,80), [80,90), [90,I00]加以统计,得到如图9-2-II

6组:

知高一年级共有学生600名,据此估计,该模块测试成绩不少于 60分的学生人数为()

0.030

0.025

0.015

0.010

0.005

A. 588 B. 480 C. 450 D. 120

【解析】 不少于60分的学生的频率为

(0.030+ 0.025 + 0.015+ 0.010)X 10= 0.8,

二该模块测试成绩不少于60分的学生人数应为600X0.8= 480.

【答案】 B

课时提升练(五十三)用样本估计总体

一、选择题

(2014河南三市联考)在检验某产品直径尺寸的过程中,将某尺寸分成若干组, [a, b)是其中的一

A.B.h

mC. mhD .与h, m无关组,抽查出的个体数在该组上的频率为 m,该组在频率分布直方图上的高为 h

A.

B.h

m

C. mh

D .与h, m无关

【解析】 因为|a — b|x h= m,所以|a — b|= m.

【答案】 A

(2014辽宁五校协作体高三联考)对于一组数据x(i = 1,2,3,…,n),如果将它们变为 % + c(i =

1,2,3,…,n),其中c为不等于零的常数,则下列结论中正确的是 ()

A .平均数与方差均不变

B .平均数与方差均改变

C.平均数改变而方差不变

D .方差改变而平均数不变

【解析】 设数据Xi(i = 1,2,3,…,n)的平均数为x,贝擞据Xi + c(i= 1,2,3,…,n)的平均数为x +

1 n —

c,即平均数发生了变化,排除 A、D.原数据的方差为s2= n刀匸1 (Xi — x)2,则数据Xi + c(i = 1,2,3,…, n)的方差 s' 2 = i- 1[(xi + c) — ( x + c)]2 = n丈匸 1(X — x )2=s2,即方差不变.

【答案】 C

3.

申31

9

% 2

1

5 7 R

7 4

2

4

图 9-2-12

(2013重庆高考)右面茎叶图9-2-12记录了甲、乙两组各五名学生在一次英语听力测试中的成绩 (单

位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x, y的值分别为()

A. 2,5B.

A. 2,5

B. 5,5 C. 5,8 D . 8,8

【解析】

由于甲组数据的中位数为15= 10+ x,.. x= 5.

又T乙组数据的平均数为

16.8,

9+ 15+ 10+ y + 18 + 24

5

二y= 8. a x, y的值分别为5,8.

【答案】 C

4. (2014 山东高考)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张

压数据(单位:kPa)的分组区间为[12,13), [13,14), [14,15), [15,16), [16,17],将其按从左到右的顺序分

别编号为第一组,第二组,…,第五组,如图 9-2-13是根据试验数据制成的频率分布直方图.已知第一

组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )

A. 6

B. 8 C. 12 D. 18

【解析】

20

志愿者的总人数为0 16 +0 24 x 1 = 50,所以第三组人数为50X 0.36= 18,有疗效的人

数为 18-6= 12.

【答案】 C

5. (2014益阳模拟)为了了解某校九年级1 600名学生的体能情况,随机抽查了部分学生,测试 1分 钟仰卧起坐的成绩(次数),将数据整理后绘制成如9-2-14图所示的频率分布直方图,根据统计图的数据,

F列结论错误的是( )

[)04

頫畅SB

002

0

5 20 25 3

? 35祝數

图 9-2-14

A .该校九年级学生1分钟仰卧起坐的次数的中位数为 26.25次

B .该校九年级学生1分钟仰卧起坐的次数的众数为 27.5次

C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人

D .该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人

【解析】 由题图可知中位数是26.25次,众数是27.5次,1分钟仰卧起坐的次数超过30次的频率 为0.2,所以估计该校九年级学生1分钟仰卧起坐的次数超过30次的人

推荐访问:统计 统计 案例 统计与统计案例-20210407005736x


[【统计与统计案例-20210407005736x】 ]相关文章