_统计与统计案例-20210411012737x

时间:2021-10-16 15:16:14  来源:网友投稿

精品文档

第九章 统计与统计案例

第一节 随机抽样

考纲要求 :1.理解随机抽样的必要性和重要性 .2.会用简单随机抽样方法从总体中抽取样本 .3.了解分层抽样和系统抽样方法.

[ 基础真题体验 ]

考查角度 [抽样方法 ]

1.(2013 ·课标全国卷Ⅰ )为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分

学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生

视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是 ( )

A.简单随机抽样 B.按性别分层抽样

C.按学段分层抽样 D.系统抽样

【解析】 由于三个学段学生的视力情况差别较大,故需按学段分层抽样.

.

精品文档

【答案】 C

2.(2014 ·四川高考 )在“世界读书日”前夕,为了了解某地 5 000 名居民某天的阅读时间,从中抽取

了 200 名居民的阅读时间进行统计分析.在这个问题中, 5 000 名居民的阅读时间的全体是 ( )

A.总体 B.个体

C.样本的容量 D.从总体中抽取的一个样本

【解析】 调查的目的是 “了解某地 5 000 名居民某天的阅读时间 ”,所以 “5 000 名居民的阅读时

间的全体 ”是调查的总体.

【答案】 A

3.(2014 ·天津高考 )某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为 300 的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为 4∶5∶5∶6,则应从一年级本科生中抽取 ________名学生.

4

【解析】 根据题意,应从一年级本科生中抽取的人数为 4+5+5+ 6×300=60.

【答案】 60

[命题规律预测 ]

从近几年的高考试题看,对本节内容的考查主要体现在以下两点:

命题规律 1.主要考查随机抽样的方法及其计算.

2.题型以选择题和填空题为主,属于中低档题.

.

精品文档

预测 2016 年高考将以分层抽样为切入点,结合实际生活背景,考查分层

考向预测

抽样的概念及相关计算 .

考向一 简单随机抽样

[典例剖析 ]

【例 1】 (2013 ·江西高考 )总体由编号为 01,02, ,19,20 的 20 个个体组成.利用下面的随机数表

选取 5 个个体,选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字,

则选出来的第 5 个个体的编号为 ( )

7816 6572 0802 6314 0702 4369 9728 0198

3204 9234 4935 8200 3623 4869 6938 7481

A.08 B.07 C.02 D.01

【思路点拨】 读数 →比较与 20 的大小 →选数 →成样

【解析】 由随机数表法的随机抽样的过程可知选出的 5 个个体是 08,02,14,07,01,所以第 5 个个体

的编号是 01.

【答案】 D

.

精品文档

抽签法与随机数表法的适用情况:

(1)抽签法适用于总体中个体数较少的情况,随机数表法适用于总体中个体数较多的情况.

(2)一个抽样试验能否用抽签法,关键看两点:

一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.

[ 对点练习 ]

下列抽样方法是简单随机抽样的是 ( )

A.从 50 个零件中一次性抽取 5 个做质量检验

B.从 50 个零件中有放回地抽取 5 个做质量检验

C.从实数集中逐个抽取 10 个正整数分析奇偶性

D.运动员从 8 个跑道中随机抽取一个跑道

【解析】 简单随机抽样是不放回、逐个、等可能的抽样,故 D 正确.

【答案】 D

.

精品文档

考向二 系统抽样及其应用

[典例剖析 ]

【例 2】 (1)(2013 陕·西高考 )某单位有 840 名职工,现采用系统抽样方法抽取 42 人做问卷调查, 将

840 人按 1,2, , 840 随机编号,则抽取的 42 人中,编号落入区间 [481,720] 的人数为 ( )

A.11 B. 12 C.13 D.14

(2)采用系统抽样方法从 960 人中抽取 32 人做问卷调查,为此将他们随机编号为 1,2, , 960,分

组后在第一组采用简单随机抽样的方法抽到的号码为 9.抽到的 32 人中,编号落入区间 [1,450]的人做问

卷 A,编号落入区间 [451,750] 的人做问卷 B,其余的人做问卷 C,则抽到的人中,做问卷 B 的人数为 ( )

A.7 B.9 C.10 D.15

【思路点拨】 (1)结合系统抽样的方法及不等式解法求解.

(2)结合系统抽样及等差数列知识求解.

840

【解析】 (1)抽样间隔为 42 =20.设在 1,2, ,20 中抽取号码 x0(x0∈[1,20]),在 [481,720] 之间抽

取的号码记为 20k+x0,则 481≤20k+x0≤720,k∈N* .

1 x0

∴2420≤k+20≤36.

.

精品文档

x0 1

∵20∈ 20,1 ,∴ k=24,25,26, ,35,

∴k 值共有 35-24+1= 12(个),即所求人数为 12.

960

(2)由系统抽样的特点知:抽取号码的间隔为 32 = 30,抽取的号码依次为 9,39,69, 939.落入区间

[451,750] 的有 459,489, ,729,这些数构成首项为 459,公差为 30 的等差数列,设有 n 项,显然有

729=459+(n-1)×30,解得 n=10.所以做问卷 B 的有 10 人.

【答案】 (1)B (2)C

系统抽样的特点:

(1)适用于元素个数很多且均衡的总体.

(2)各个个体被抽到的机会均等.

(3)总体分组后,在起始部分抽样时采用的是简单随机抽样.

N

(4)如果总体容量 N 能被样本容量 n 整除,则抽样间隔为 k= n .

提醒:如果总体容量 N 不能被样本容量 n 整除,可随机地从总体中剔除余数,然后再按系统抽样的方法抽样.

.

精品文档

[ 对点练习 ]

高三 (1)班共有 56 人,学号依次为 1,2,3, ,56,现用系统抽样的方法抽取一个容量为 4 的样本.已

知学号为 6,34,48 的同学在样本中,那么还有一个同学的学号应为

( )

A.30 B.25 C.20 D.15

【解析】 由题意可知,可将学号依次为 1,2,3, , 56 的 56 名同学分成 4 组,每组 14 人,抽取

的样本中,若将他们的学号按从小到大的顺序排列,彼此之间会相差 14,故还有一个同学的学号应为

14+6=20.

【答案】 C

考向三 分层抽样及其应用

[典例剖析 ]

【例 3】 (2013 ·湖南高考 )某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为 120 件, 80

件,60 件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为 n 的样本进行

调查,其中从丙车间的产品中抽取了 3 件,则 n=( )

A.9 B.10 C.12 D.13

.

精品文档

(2)(2014 湖·北高考 )甲、乙两套设备生产的同类型产品共 4 800 件,采用分层抽样的方法从中抽取一

个容量为 80 的样本进行质量检测.若样本中有 50 件产品由甲设备生产,则乙设备生产的产品总数为

________件.

样本容量 各层样本容量

【思路点拨】 利用 “抽样比= 总体容量 =各层个体数量 ”求解 (1)(2).

【解析】 (1)依题意得 3 = n ,故 n=13.

60 120+80+60

(2)设乙设备生产的产品总数为 x 件,则甲设备生产的产品总数为 (4 800-x)件.由分层抽样特点,

50 4 800-x

结合题意可得 80= 4 800 ,解得 x=1 800.

【答案】 (1)D (2)1 800

与分层抽样有关问题的常见类型及解题策略:

(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.

(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数 (或样本数 )确定该层

的样本 (或总体 )数.

(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数.

[ 对点练习 ]

某校共有学生 2 000 名,各年级男、女生人数如下表.已知在全校学生中随机抽取 1 名,抽到二

.

精品文档

年级女生的概率是 0.19,现用分层抽样的方法在全校抽取 64 名学生,则应在三年级抽取的学生人数为

( )

一年级

二年级

三年级

女生

373

x

y

男生

377

370

z

A.24 B.18 C.16 D.12

【解析】 根据题意可知二年级女生的人数应为 2 000×0.19= 380(人),故一年级共有人数 750 人,

750

二年级共有 750 人,这两个年级均应抽取 64×2 000=24(人),则应在三年级抽取的学生人数为 64-24×2

=16(人).【答案】 C

误区分析 17 忽视“抽样比”相等导致分层抽样失误

.

精品文档

[ 典例剖析 ]

【典例】 (2015 ·洛阳模拟 )交通管理部门为了解机动车驾驶员 (简称驾驶员 )对某新法规的知晓情况,

对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为 N,其中甲社区有驾驶员

96 人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为 12,21,25,43,则这四个社区驾驶员的总人

数N为( )

A.101 B.808 C.1 212 D.2 012

【解析】 四个社区共抽取了 12+21+25+43=101 人.

12

又由题意可知抽样比为 96,

101

故96= N ,

样本容量

此处在求解时,因不理解 “总体容量 =抽样比 ”致误

解得 N=808.

【答案】 B

1.对于分层抽样问题,其解决的关键是抓住

样本容量

【防范措施】

“总体容量 =抽样比 ”建立等量关系.

2.等可能性入样是所有简单随机抽样的大前提.

.

精品文档

[ 对点练习 ]

某工厂的一、二、三车间在 12 月份共生产了 3 600 双皮靴,在出厂前要检查这批产品的质量,决

定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为 a、b、c,且 a、b、c 构成

等差数列,则二车间生产的产品数为 ( )

A.800 B.1 000 C.1 200 D. 1 500

【解析】 设该厂的一、二、三车间生产的产品数分别为 x,y,z,由题意可知 x∶y∶z=a∶b∶c,

又 a,b,c 成等差数列,所以 2b=a+c,

即 2y=x+ z.

又 x+y+z=3 600,∴ 3y=3 600, y=1 200.

【答案】 C

课堂达标训练

1.(2013 ·湖南高考 )某学校有男、女学生各 500 名,为了解男、女学生在学习兴趣与业余爱好方面

是否存在显著差异,拟从全体学生中抽取 100 名学生进行调查,则宜采用的抽样方法是 ( )

A.抽签法 B.随机数法

C.系统抽样法 D.分层抽样法

【解析】 由于是调查男、 女学生在学习兴趣与业余爱好方面是否存在差异, 因此用分层抽样方法.

【答案】 D

.

精品文档

2.从 30 个个体中抽取 10 个样本,现给出某随机数表的第

11 行到第 15 行(见下表 ),如果某人选取

第 12 行的第 6 列和第 7 列中的数作为第一个数并且由此数向右读,

则选取的前 4 个的号码分别为 ()

9264 4607 2021 3920 7766 3817 3256 1640

5858 7766 3170 0500 2593 0545 5370 7814

2889 6628 6757 8231 1589 0062 0047 3815

5131 8186 3709 4521 6665 5325 5383 2702

9055 7196 2172 3207 1114 1384 4359 4488

A.76,63,17,00

B.16,00,02,30

C.17,00,02,25

D.17,00,02,07

【解析】 在随机数表中,将处于

00~29 的号码选出,第一个数

76 不合要求,第

2个 63不合要

求,满足要求的前 4 个号码为 17,00,02,07.

【答案】 D

3.从 2 014 名学生中选取 50 名组成参观团,若采用下面的方法选取:先用简单随机抽样法从 2 014 名学生中剔除 14 名学生,再用系统抽样法从剩下的 2 000 名学生中选取 50 名学生.则每人入选的概率

()

A.不全相等

B.均不相等

25

1

C.都相等,且为 1 007

D.都相等,且为 40

50

25

【解析】 抽样过程中每个个体被抽取的机会均等,概率相等,故每人入选的概率为

2 014=

1 007.

.

精品文档

故选 C.

【答案】 C

4.某学校高一、高二、高三年级的学生人数之比为 3∶3∶4,现用分层抽样的方法从该校高中三个

年级的学生中抽取容量为 50 的样本,则应从高二年级抽取 ________名学生.

3×50

【解析】 由分层抽样的特征可知,应从高二年级抽取 10 =15.

【答案】

15

课时提升练 (五十二 ) 随机抽样

一、选择题

1.(2014 ·广东高考 )为了解 1 000 名学生的学习情况,采用系统抽样的方法,从中抽取容量为

40 的

样本,则分段的间隔为 (

)

A.50

B.40

C.25

D. 20

1 000

【解析】

根据系统抽样的特点可知分段间隔为

40 =25,故选 C.

【答案】

C

2.(2014 重·庆高考 )某中学有高中生

3 500 人,初中生 1 500 人.为了解学生的学习情况,用分层抽

样的方法从该校学生中抽取一个容量为

n 的样本,已知从高中生中抽取

70 人,则 n 为()

A.100

B.150C.200D .250

【解析】

法一:由题意可得 70

=3 500,解得 n=100,故选 A.

n-70 1 500

.

精品文档

70 1 1

法二:由题意,抽样比为 3 500=50,总体容量为 3 500+1 500=5 000,故 n=5 000×50=100.

【答案】 A

3.(2014 ·石家庄模拟 )某学校在高三年级一班共有 60 名学生,现采用系统抽样的方法从中抽取 6 名

学生做“早餐与健康”的调查,为此将学生编号为 1,2, , 60.选取的这 6 名学生的编号可能是 ( )

A.1,2,3,4,5,6 B.6,16,26,36,46,56

C.1,2,4,8,16,32 D.3,9,13,27,36,54

【解析】 系统抽样是等间隔抽样.

【答案】 B

4.某单位共有老、中、青职工 430 人,其中有青年职工 160 人,中年职工人数是老年职工人数的 2

倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工 32 人,则该样

本中的老年职工人数为 ( )

A.9 B.18 C.27 D.36

【解析】 设该单位老年职工有 x 人,从中抽取 y 人.

则 160+3x=430? x= 90,即老年职工有 90 人,

90 y

即160=32? y=18.

【答案】 B

5.将参加夏令营的 600 名学生编号为: 001,002, , 600.采用系统抽样方法抽取一个容量为

50 的

.

精品文档

样本,且随机抽得的号码为 003.这 600 名学生分住在三个营区, 从 001 到 300 在第Ⅰ营区,从 301 到 495

在第Ⅱ营区,从

496 到 600 在第Ⅲ营区,则三个营区被抽中的人数依次为 ()

A.26,16,8

B.25,17,8

C.25,16,9

D.24,17,9

600

【解析】

由题意知,间隔 k= 50 =12,故抽到的个体编号为

12k+3(其中 k=0,1,2,3, ,49).令

12k+3≤300,解得 k≤24.

∴k=0,1,2, ,24,共 25 个编号.

所以从Ⅰ营区抽取 25 人;

令 300<12k+3≤495,解得 25≤k≤41

∴k=25,26,27, ,41,共 17 个编号.

所以从Ⅱ营区抽取 17 人;

因此从第Ⅲ营区抽取 50-25-17=8(人).

【答案】 B

6.某初级中学有学生 270 人,其中一年级 108 人,二、三年级各 81 人,现要利用抽样方法抽取 10

人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽

样时,将学生按一、二、三年级依次统一编号为 1,2, , 270,使用系统抽样时,将学生统一随机编号

为 1,2, , 270,并将整个编号依次分为 10 段,如果抽得号码有下列四种情况: ①7,34,61,88,115,142,169,196,223,250

.

精品文档

②5,9,100,107,111,121,180,195,200,265

③11,38,65,92,119,146,173,200,227,254

④30,57,84,111,138,165,192,219,246,270

关于上述样本的下列结论中,正确的是 ( )

A.②、③都不能为系统抽样

B.②、④都不能为分层抽样

C.①、④都可能为系统抽样

D.①、③都可能为分层抽样

【解析】 因为③为系统抽样,所以选项 A 不对;因为②为分层抽样,所以选项 B 不对;因为④不

为系统抽样,所以选项 C 不对,故选 D.

【答案】 D

二、填空题

7.(2014 ·汉中模拟 )用系统抽样法要从 160 名学生中抽取容量为 20 的样本,将 160 名学生随机地从1~160 编号,按编号顺序平均分成 20 组(1~8 号,9~16 号, , 153~160 号),若第 16 组抽出的号码为 126,则第 1 组中用抽签的方法确定的号码是 ________.

【解析】 设第 1 组抽取的号码为 b,则第 n 组抽取的号码为 8(n-1)+b,

∴8×(16-1)+b=126,∴ b=6,故第 1 组抽取的号码为 6.

【答案】 6

.

精品文档

8.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有 40 种、 10 种、 30

种、 20 种,现从中抽取一个容量为 20 的样本进行食品安全检验.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种类之和是 ________.

20 1

【解析】 ∵四类食品的每一种被抽到的概率为 100=5,∴植物油类和果蔬类食品被抽到的种数之

1

和为 (10+20)×5=6.

【答案】 6

9.某单位 200 名职工的年龄分布情况如图 9-1-1 所示,现要从中抽取 40 名职工作样本,用系统抽

样法将全体职工随机按 1~200 编号,并按编号顺序平均分为 40 组(1~ 5 号, 6~10 号, , 196~200

号).若第 5 组抽出的号码为 22,则第 8 组抽出的号码应是 ________.若用分层抽样方法,则 40 岁以下年龄段应抽取 ________人.

图 9-1-1

【解析】 由分组可知,抽号的间隔为 5,

又因为第 5 组抽出的号码为 22,

所以第 6 组抽出的号码为 27,第 7 组抽出的号码为 32,第 8 组抽出的号码为 37.

40 岁以下的年龄段的职工数为 200×0.5= 100,

.

精品文档

40

则应抽取的人数为 200×100=20(人).

【答案】 37 20

三、解答题

10.中央电视台为了解观众对 《中国好歌曲》 的意见,准备从 502 名现场观众中抽取 10%进行座谈,

请用系统抽样的方法完成这一抽样.

【解】 把 502 名观众平均分成 50 组,由于 502 除以 50 的商是 10,余数是 2,所以每组有 10 名

观众,还剩 2 名观众 ,采用系统抽样的方法抽样的步骤如下:

第一步,先用简单随机抽样的方法从 502 名观众中抽取 2 名观众,这 2 名观众不参加座谈;

500

第二步,将剩下的 500 名观众编号为 1,2,3, ,500,并均匀分成 50 段,每段含 50 =10 个个体;

第三步,从第 1 段即 1,2, ,10 这 10 个编号中,用简单随机抽样的方法抽取一个编号 (比如 l)作为

起始编号;

第四步,从 l 开始,再将编号为 l +10,l +20,l +30, ,l +490 的个体抽出,得到一个容量为 50 的样本.

11.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度 (学历 )的调查,其结果 (人数

分布 )如下表:

学历

35 岁以下

35~50 岁

50 岁以上

本科

80

30

20

.

精品文档

研究生 x 20 y

(1)用分层抽样的方法在 35~ 50 岁年龄段的专业技术人员中抽取一个容量为 5 的样本,将该样本看

成一个总体,从中任取 2 人,求至少有 1 人学历为研究生的概率;

(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取 N 个人,其中 35 岁以下 48 人,

5

50 岁以上 10 人,再从这 N 个人中随机抽取 1 人,此人的年龄为 50 岁以上的概率为 39,求 x,y 的值.

【解】 (1)用分层抽样的方法在 35~50 岁年龄段的专业技术人员中抽取一个容量为 5 的样本,设

m

抽取学历为本科的人数为 m,∴ 50= 5 ,解得 m=3.

抽取的样本中有研究生 2 人,本科生 3 人,分别记作 S1,S2;B1,B2,B3.

从中任取 2 人的所有等可能基本事件共有 10 个: (S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2, B3),

其中至少有 1 人的学历为研究生的基本事件有 7 个: (S1,B1), (S1,B2),(S1, B3),(S2,B1),(S2,B2),(S2,B3), (S1,S2).

7

∴从中任取 2 人,至少有 1 人学历为研究生的概率为 10.

10 5

(2)由题意,得 N =39,解得 N=78.

∴35~50 岁中被抽取的人数为 78-48-10=20,

48 20 10

∴80+x=50=20+ y,解得 x=40,y=5.

.

精品文档

即 x,y 的值分别为 40,5.

12.某单位最近组织了一次健身活动, 活动分为登山组和游泳组, 且每个职工至多参加其中一组. 在参加活动的职工中,青年人占 42.5%,中年人占 47.5%,老年人占 10%.登山组的职工占参加活动总人数

1

的4,且该组中,青年人占 50%,中年人占 40%,老年人占 10%.为了了解各组不同年龄层次的职工对本

次活动的满意程度,现用分层抽样方法从参加活动的全体职工中抽取一个容量为 200 的样本.试确定:

(1)游泳组中,青年人、中年人、老年人分别所占的比例;

(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.

【解】 (1)设登山组人数为 x,游泳组中青年人、中年人、老年人各占比例分别为 a、b、 c,则有

x·40%+3xb=47.5%, x·10%+3xc=10%,

4x 4x

解得 b=50%,c=10%,则 a=40%,

即游泳组中,青年人、中年人、老年人各占比例分别为 40%、50%、10%.

(2)游泳组中

3

抽取的青年人数为 200×4×40%=60(人);

3

抽取的中年人数为 200×4×50%=75(人);

3

抽取的老年人数为 200×4×10%=15(人).

.

精品文档

第二节 用样本估计总体

考纲要求 :1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、

茎叶图,理解它们各自的特点 .2.理解样本数据标准差的意义和作用,会计算数据标准差 .3.能从样本数据中提取基本的数字特征 (如平均数、标准差 ),并给出合理的解释 .4.会用样本的频率分布估计总体分布,

会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想 .5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.

[ 基础真题体验 ]

考查角度 [样本数据的数字特征 ]

1.(2012 ·山东高考 )在某次测量中得到的 A 样本数据如下: 82,84,84,86,86,86,88,88,88,88若. B 样本数

据恰好是 A 样本数据每个都加 2 后所得数据.则 A,B 两样本的下列数字特征对应相同的是 ( )

A.众数 B.平均数

C.中位数 D.标准差

【解析】 对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、

平均数都发生改变.

【答案】 D

考查角度 [茎叶图 ]

2.(2013 ·课标全国卷Ⅰ )为了比较两种治疗失眠症的药 (分别称为 A 药, B 药)的疗效,随机地选取

.

精品文档

20 位患者服用 A 药,20 位患者服用 B 药,这 40 位患者在服用一段时间后, 记录他们日平均增加的睡眠

时间 (单位: h).试验的观测结果如下:

服用 A 药的 20 位患者日平均增加的睡眠时间:

0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2

3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1

2.3 2.4

服用 B 药的 20 位患者日平均增加的睡眠时间:

3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3

1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2

2.7 0.5

(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?

(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?

图 9-2-1

【解】 (1)设 A 药观测数据的平均数为 x ,B 药观测数据的平均数为 y .

.

精品文档

由观测结果可得

1

=20(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+ 2.7+2.8+2.9+3.0+3.1

3.2+ 3.5)=2.3,

1

y =20(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+ 1.9+2.1+2.4+2.5+2.6

+2.7+ 3.2)=1.6.

由以上计算结果可得 x > y ,因此可看出 A 药的疗效更好.

(2)由观测结果可绘制茎叶图如图:

7

从以上茎叶图可以看出, A 药疗效的试验结果有 10的叶集中在茎 “2.”,“3.”上,而 B 药疗效的试验结

7

果有 10的叶集中在茎 “0.”, “1.”上,由此可看出 A 药的疗效更好.

考查角度 [频率分布直方图 ]

3.(2014 ·课标全国卷Ⅰ )从某企业生产的某种产品中抽取 100 件,测量这些产品的一项质量指标值,

由测量结果得如下频数分布表:

质量指标值分[75,85)

[85,95)

[95,105)

[105,115)

[115,125)

.

精品文档

频数

6

26

38

22

8

(1)作出这些数据的频率分布直方图;

(2)

估计这种产品质量指标值的平均数及方差 (同一组中的数据用该组区间的中点值作代表

);

(3)

根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于

95 的产品至

少要占全部产品 80%”的规定?

【解】 (1)

.

精品文档

(2)质量指标值的样本平均数为

=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08= 100.

x

质量指标值的样本方差为 s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.

所以这种产品质量指标值的平均数的估计值为 100,方差的估计值为 104.

(3)质量指标值不低于 95 的产品所占比例的估计值为 0.38+0.22+0.08=0.68.

由于该估计值小于 0.8,故不能认为该企业生产的这种产品符合 “质量指标值不低于 95 的产品至少要占全部产品 80%”的规定.

.

精品文档

[命题规律预测 ]

从近几年的高考试题看,对本节内容的考查体现在以两个方面:

1.频率分布直方图、茎叶图、平均数、方差是高考的热点.

命题规律

2.题型以解答题为主,常以现实生活为背景与概率等知识结合命题,难度

中等偏下.

预测 2016 年高考将以生活中的实际为载体,考查学生借助统计图表、样

考向预测

本数据的数字特征及概率知识解决实际问题的能力 .

考向一 频率分布直方图及其应用

[ 典例剖析 ]

【例 1】 (2012 ·广东高考 )某校 100 名学生期中考试语文成绩的频率分布直方图如图 9-2-2 所示,其

中成绩分组区间是: [50,60),[60,70),[70,80),[80,90),[90,100] .

.

精品文档

图 9-2-2

(1)求图中 a 的值;

(2)根据频率分布直方图,估计这 100 名学生语文成绩的平均分;

(3)若这 100 名学生语文成绩某些分数段的人数 (x)与数学成绩相应分数段的人数 (y)之比如下表所示,

求数学成绩在 [50,90)之外的人数 .

分数段

[50,60)

[60,70)

[70,80)

[80,90)

x∶y

1∶1

2∶1

3∶4

4∶5

【思路点拨】

(1)直方图中各个矩形的面积代表了频率,所以各个矩形面积之和为

1,可求出 a 的

值;(2)语文成绩的平均分采取每个小矩形的面积乘以矩形底边中点横坐标之和来求得; (3)先求出各段中

语文成绩人数,再由比例求出各段中的数学成绩人数.

【解】 (1)由频率分布直方图知: (2a+0.02+0.03+0.04)×10=1,解得 a=0.005.

.

精品文档

由频率分布直方图知:这100 名学生语文成绩的平均分为55×0.005×10+65×0.04×10+

75×0.03×10+85×0.02×10+95×0.005×10=73(分).

由频率分布直方图知:语文成绩在[50,60) ,[60,70) , [70,80), [80,90)各分数段的人数依次为

0.005× 10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.

由题中给出的比例关系知数学成绩在上述各分数段的人数依次为

5,40×

1= 20,30×4=40,20×5=

2

3

4

25.

故数学成绩在 [50,90)之外的人数为 100-(5+20+40+25)=10.

.

精品文档

.

精品文档

[ 对点练习 ]

(2014 ·江苏高考 )为了了解一片经济林的生长情况,随机抽测了其中 60 株树木的底部周长 (单位:

cm),所得数据均在区间 [80,130] 上,其频率分布直方图如图 9-2-3 所示,则在抽测的 60 株树木中,有

________株树木的底部周长小于 100 cm.

图 9-2-3

【解析】 底部周长在 [80,90)的频率为 0.015×10=0.15,底部周长在 [90,100)的频率为 0.025×10=0.25,样本容量为 60,所以树木的底部周长小于 100 cm 的株数为 (0.15+0.25)×60=24.

【答案】 24

考向二 茎叶图的绘制及应用

.

精品文档

[ 典例剖析 ]

【例 2】 某良种培育基地正在培育一种小麦新品种 A,将其与原有的一个优良品种 B 进行对照

验.两种小麦各种植了 25 亩,所得亩产数据 (单位:千克 )如下:

品种 A:357,359,367,368,375,388,392,399,400,405,

412,414,415,421,423,423,427,430,430,434,

443,445,445,451,454

品种 B:363,371,374,383,385,386,391,392,394,394,

395,397,397,400,401,401,403,406,407,410,

412,415,416,422,430

(1)完成数据的茎叶图.

(2)用茎叶图处理现有的数据,有什么优点?

(3)通过观察茎叶图,对品种 A 与 B 的亩产量及其稳定性进行比较,写出统计结论.

【思路点拨】 由百位数和十位数作茎,以个位数作叶,画出茎叶图,并依据数据的集中程度分析

品种 A 与 B 亩产量及其稳定性的差异.

【解】 (1)如图所示:

.

精品文档

(2)由于每个品种的数据都只有 25 个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰、明了地

展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.

(3)通过观察茎叶图可以看出:①品种 A 的亩产平均数 (或均值 )比品种 B 高;②品种 A 的亩产标准差

(或方差 )比品种 B 大,故品种 A 的亩产稳定性较差.

茎叶图的制作及应用:

(1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.

(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进

一步估计总体情况.

(3)制作茎叶图的一般方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同

者共用一个茎,茎按从小到大顺序由上到下列出.

.

精品文档

[ 对点练习 ]

(2014 ·岳阳模拟 )甲、乙两位歌手在“中国好声音”选拔赛中, 5 次得分情况如图 9-2-4 所示.记甲、

乙两人的平均得分分别为 x 甲 、 x 乙 ,则下列判断正确的是 ( )

图 9-2-4

x 甲< x 乙,甲比乙成绩稳定

x 甲< x 乙,乙比甲成绩稳定

x 甲> x 乙,甲比乙成绩稳定

x 甲> x 乙,乙比甲成绩稳定

76+77+88+90+94

【解析】 x 甲 = =85,

5

.

精品文档

75+88+86+88+93

x 乙 = =86,

5

s2 =1[(76- 85)2+(77-85)2+(88-85)2+(90-85)2+(94-85)2]=52,

5

s2 =1[(75- 86)2+(88-86)2+(86-86)2+(88-86)2+(93-86)2]=35.6.

5

所以 x < x , s2 >s2 ,故乙比甲成绩稳定.

甲 乙 甲 乙

【答案】 B

考向三 数字特征的总体估计

[ 典例剖析 ]

【例 3】 (理)(1)(2014 陕·西高考 )设样本数据 x1,x2, , x10 的均值和方差分别为 1 和 4,若 yi=xi

+a(a 为非零常数, i=1,2, , 10),则 y1,y2, , y10 的均值和方差分别为 ( )

A.1+a,4 B.1+a,4+a

C.1,4 D.1,4+a

(2)(2012 安·徽高考 )甲、乙两人在一次射击比赛中各射靶 5 次,两人成绩的条形统计图如图 9-2-5

所示,则 ( )

.

精品文档

图 9-2-5

A.甲的成绩的平均数小于乙的成绩的平均数

B.甲的成绩的中位数等于乙的成绩的中位数

C.甲的成绩的方差小于乙的成绩的方差

D.甲的成绩的极差小于乙的成绩的极差

【思路点拨】 (1)由样本数据数字特征的性质求解;

【解析】 (1)x1+ x2+ +x10= 1,yi=xi+a,所以 y1,y2, ,y10 的均值为 1+a,方差不变仍为 10

4.故选 A.

(2)由条形统计图知:

甲射靶 5 次的成绩分别为: 4,5,6,7,8;

.

精品文档

乙射靶 5 次的成绩分别为: 5,5,5,6,9,

所以 x 甲 =

4+5+6+7+8

5+5+ 5+6+ 9

5

=6; x 乙=

5

=6.

所以 x 甲 = x 乙. 故 A 不正确.

甲的成绩的中位数为

6,乙的成绩的中位数为

5,故 B 不正确.

2

1

2

+(5-6)

2

+(6-6)

2

2

2

1

2

1

2

2

+(5-6)

2

(6-6)

2

2

1

12

12

2

2

正确.甲的成绩的极差为:

8-4=4,乙的

成绩的极差为: 9-5=4,故 D 不正确.故选 C.

【答案】 (1)A (2)C

(1)数字特征的意义

平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实

际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.

(2)方差的简化计算公式

s2

1

1

= [( x12+x22+ + xn2)-n x 2],或写成 s2= (x12+x22+ + xn2)- x 2,即方差等于原数据平方的平均数

n

n

减去平均数的平方.

.

精品文档

[ 对点练习 ]

(2013 ·山东高考 )将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最低分, 7 个剩余分数的平均分为 91,现场作的 9 个分数的茎叶图后来有 1 个数据模糊,无法辨认,在图中以 x 表示:

8 7 7

9 4 0 1 0 x 9 1

图 9-2-13

则 7 个剩余分数的方差为 (

)

116

36

6

7

A. 9

B. 7

C.36

D.

7

【解析】

根据茎叶图,去掉

1 个最低分 87,1 个最高分 99,

则1[87+ 94+90+91+90+(90+x)+91]=91,

7

∴x=4.

1

36

∴s2=7[(87-91)2+(94-91)2+(90-91)2+ (91-91)2+(90-91)2+(94-91)2

+(91-91)2

]=7.

【答案】

B

满分指导 17

应用频率直方图对总体作出估计

.

精品文档

[ 典例剖析 ]

【典例】 (12 分)(2014 ·贵州适应性练习 )某学校随机抽取部分新生调查其上学所需时间 (单位:分

钟),并将所得数据绘制成频率分布直方图 (如图 9-2-6),其中,上学所需时间的范围是 [0,100] ,样本数据分组为 [0,20),[20,40),[40,60),[60,80),[80,100] .

图 9-2-6

(1)求直方图中 x 的值;

(2)如果上学所需时间不少于 1 小时的学生可申请在学校住宿,若该学校有 600 名新生,请估计新生

中有多少名学生可以申请住宿;

(3)由频率分布直方图估计该校新生上学所需时间的平均值.

【审题指导】

.

精品文档

信息提取

破题技巧

(1)

频率分布直方图已知

频率分布直方图中,每个矩形的面积恰好是该组的

频率,各个小矩形的面积之和等于

1

(2)

大于等于 1 小时的频率可求, 计算出新生上学所需时间不少于

1 小时的频率,乘

学校总人数已知

以 600

即得结果.

(3)

频率分布直方图已知

平均数的估计值等于频率分布直方图中每个小矩形

的面积乘以小矩形底边中点的横坐标之和 .

【规范解答】 (1)由直方图可得: 20×x+ 0.025×20+0.006 5×20+0.003×2×20=1.所以 x=0.012

5.3 分

(2)新生上学所需时间不少于 1 小时的频率为 0.003×2×20=0.12.5 分

因为 600×0.12=72,所以 600 名新生中有 72 名学生可以申请住宿 .7 分

(3)由题可知

0.012 5×20×10+0.025×20×30+0.006 5×20×50+0.003×20×70+0.003×20×90

=20×(0.012 5×10+0.025×30+0.006 5×50+0.003×70+0.003×90)=33.6 分钟.

故该校新生上学所需时间的平均值为 33.6 分钟 .12 分

【名师寄语】 (1)本题的难点是对频率分布直方图意义的理解以及应用这个图提供的数据对所提

问题的计算.

(2)此类题的常见易错点是频率分布直方图中纵轴上的数据是频率除以组距,而非频率.

.

精品文档

[ 对点练习 ]

(2014 ·合肥模拟 )合肥市环保总站对 2013 年 11 月合肥市空气质量指数发布如下趋势图:

图 9-2-7

AQI 指数

天数

(60,120]

(120,180]

(180,240]

(240,300]

表 1

(1)请根据以上趋势图,完成表

1 并根据表 1 画出频率分布直方图;

(2)试根据频率分布直方图估计合肥市 11 月份 AQI 指数的平均值.

【解】 (1)

.

精品文档

AQI 指数

天数

(60,120]

11

(120,180]

11

(180,240]

5

(240,300]

3

(2)合肥市 11 月份 AQI 指数的平均值 x =11×90+11×150+

5 ×210+

3 ×270=150.

30

30

30

30

.

精品文档

课堂达标训练

1.从一堆苹果中任取 10 只,称得它们的质量如下 (单位:克 ):

125,120,122,105,130,114,116,95,120,134.

则样本数据落在 [114.5,124.5)内的频率为 ()

A.0.2

B.0.3C.0.4D.0.5

【解析】

样本数据落在 [114.5,124.5] 内的共有 4 个,故其频率为

4 =0.4.

10

【答案】

C

2.(2015 ·苏启东中学模拟江

)如图 9-2-8 为某个容量为 100 的样本的频率分布直方图, 分组为 [96,98) ,

[98,100),[100,102) ,[102,104) ,[104,106] ,则在区间 [98,100)上的数据的频数为 ( )

图 9-2-8

A.0.1 B.0.2 C.20 D .10

.

精品文档

【解析】 由频率直方图可知 0.1×(100-98)×100=20.

【答案】 C

3.(2012 ·陕西高考 )对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图

(如图 9-2-9

所示 ),则该样本的中位数、众数、极差分别是 ( )

图 9-2-9

A.46,45,56

B.46,45,53

C.47,45,56

D.45,47,53

【解析】 由题意知各数为 12,15,20,22,23,23,31,32,34,34,

38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是 46,众数是 45,最大数为 68,最

小数为 12,极差为 68-12=56.

【答案】 A

4.如图 9-2-10 是Ⅰ,Ⅱ两组各 7 名同学体重 (单位: kg)数据的茎叶图.设Ⅰ,Ⅱ两组数据的平均数

.

精品文档

依次为 x 1 和 x 2,标准差依次为 s1 和 s2,那么 ( )

图 9-2-10

A. x 1> x 2,s1>s2

B. x 1> x 2,s1<s2

C. x 1< x 2,s1>s2

D. x 1< x 2,s1<s2

316

342

【解析】

由题意可得 x 1=61, x 2=62,s1=

7 ,s2=

7

,故选 D.

【答案】

D

5.(2013 ·福建高考 )某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成 6 组:

[40,50),[50,60) ,[60,70)[70,80) ,[80,90),[90,100] 加以统计,得到如图 9-2-11 所示的频率分布直方图. 已

知高一年级共有学生 600 名,据此估计,该模块测试成绩不少于 60 分的学生人数为 ( )

.

精品文档

图 9-2-11

A.588 B.480 C.450 D.120

【解析】 不少于 60 分的学生的频率为

(0.030+0.025+0.015+0.010)×10=0.8,∴该模块测试成绩不少于 60 分的学生人数应为 600×0.8=480.【答案】 B

课时提升练 (五十三 ) 用样本估计总体

一、选择题

1.(2014 ·南三市联考河 )在检验某产品直径尺寸的过程中,将某尺寸分成若干组, [a,b)是其中的一

组,抽查出的个体数在该组上的频率为 m,该组在频率分布直方图上的高为 h,则 |a-b|等于 ( )

m h

A. h B.m C.mh D.与 h,m 无关

.

精品文档

m

【解析】

因为 |a-b|×h=m,所以 |a-b|= h .

【答案】

A

2.(2014 ·辽宁五校协作体高三联考 )对于一组数据

xi(i =1,2,3, , n),如果将它们变为

xi +c(i=

1,2,3, , n),其中 c 为不等于零的常数,则下列结论中正确的是

()

A.平均数与方差均不变

B.平均数与方差均改变

C.平均数改变而方差不变

D.方差改变而平均数不变

【解析】

设数据 xi

, ,

n)

的平均数为

x

,则数据

i+c(i=1,2,3, ,n)的平均数为 x +

(i

1,2,3

x

,即平均数发生了变化,排除

原数据的方差为

1 n

i- x )2,则数据 xi+c(i=1,2,3, ,

A

D.

2= ∑

c

s

n i= 1

(x

的方差 ′2

1 n

1 n

i - x )2=s2,即方差不变.

n)

= ∑

i = 1[(x

i+ c)-( x +c)] 2= ∑

s

n

n i= 1

(x

【答案】 C

3.

图 9-2-12

(2013 ·重庆高考 )右面茎叶图 9-2-12 记录了甲、乙两组各五名学生在一次英语听力测试中的成绩 (单

.

精品文档

位:分 ).已知甲组数据的中位数为

15,乙组数据的平均数为

16.8,则 x,y 的值分别为 ()

A.2,5B. 5,5C.5,8

D.8,8

【解析】 由于甲组数据的中位数为 15=10+x,∴ x=5.

9+ 15+ 10+y +18+24

又∵乙组数据的平均数为

5

=16.8,∴ y=8.∴x,y 的值分别为 5,8.

【答案】 C

4.(2014 ·山东高考 )为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张

压数据 (单位: kPa)的分组区间为 [12,13),[13,14) ,[14,15),[15,16),[16,17] ,将其按从左到右的顺序分

别编号为第一组,第二组, ,第五组,如图 9-2-13 是根据试验数据制成的频率分布直方图.已知第一

组与第二组共有 20 人,第三组中没有疗效的有 6 人,则第三组中有疗效的人数为 ( )

图 9-2-13

A.6

B.8C.12

D.18

20

【解析】

志愿者的总人数为

0.16+0.24 ×1=50,所以第三组人数为

50×0.36=18,有疗效的人

数为 18-6=12.

【答案】 C

.

精品文档

5.(2014 ·益阳模拟 )为了了解某校九年级 1 600 名学生的体能情况,随机抽查了部分学生,测试 1 分

钟仰卧起坐的成绩 (次数 ),将数据整理后绘制成如 9-2-14 图所示的频率分布直方图, 根据统计图的数据,

下列结论错误的是 ( )

图 9-2-14

A.该校九年级学生 1 分钟仰卧起坐的次数的中位数为 26.25 次

B.该校九年级学生 1 分钟仰卧起坐的次数的众数为 27.5 次

C.该校九年级学生 1 分钟仰卧起坐的次数超过 30 次的人数约有 320 人

D.该校九年级学生 1 分钟仰卧起坐的次数少于 20 次的人数约有 32 人

【解析】 由题图可知中位数是 26.25 次,众数是 27.5 次,1 分钟仰卧起坐的次数超过 30 次的频率为 0.2,所以估计该校九年级学生 1 分钟仰卧起坐的次数超过 30 次的人数约有 320 人; 1 分钟仰卧起坐的次数少于 20 次的频率为 0.1,所以该校九年级学生 1 分钟仰卧起坐的次数少于 20 次的人数约有 160 人.故 D 是错误的,选 D.

【答案】 D

6.(2013 ·四川高考 )某学校随机抽取 20 个班,调查各班中有网上购物经历的人数,所得数据的茎叶

.

精品文档

图如图 9

推荐访问:统计 统计 案例 统计与统计案例-20210411012737x


[_统计与统计案例-20210411012737x]相关文章