统计例题及统计简答题 统计简答题

时间:2021-11-01 09:28:30  来源:网友投稿

平均数

一、中位数101名电光性眼炎患者发病潜伏期发病潜伏期 病例数 累计频数

101名电光性眼炎患者发病潜伏期

发病潜伏期 病例数 累计频数

(小时) (f) (Σf)

0- 7 7

2- 12 19

4- 22 41

6- 25 66

8- 14

10- 9

12- 4

14- 2

16- 2

18- 0

20- 1

22- 1

24- 2

合计 101(n)

频数表法

(1)计算出中位数的排列位置:用n×50%(或÷2)获得。以左表资料为例,共101个数据,101×50%=50.5,表示中位数排列在第50.5位。

(2)找到中位数所在的组段:

即第50.5位的数据所在的组段——“6-”组段。确定中位数所在组段,是频数表法计算的关键。从左表可见,数值<6的数据共累计了41个,排列在第42位的数据已经进入了组段“6-”;该组段共有数据25个(数值均>6但<8),它们的排列顺序分别是第42~66位。而中位数排在第50.5位,显然位于它们之中,即落在“6-”组段内。

M=

M=Lm+ (n×50%-ΣfL)

i

fm

式中:Lm=中位数所在组段的下限(最小值)

i=中位数所在组段的组距

fm=中位数所在组段内的频数

ΣfL=中位数所在组段之前的累计频数

M

M=Lm+ (n×50%-ΣfL)=6+ (101×50%-41)=6.76

i

fm

2

25

结果:电光性眼炎的平均发病潜伏期为6.76小时。

U检验

两样本均数比较的假设检验

例:某医院研究劳动类型与血清胆固醇的关系,调查结果为脑力劳动组537人,平均胆固醇水平为4.8mmol/L,标准差为0.72mmol/L;体力劳动组643人,平均数为4.6mmol/L,标准差为0.81mmol/L。问两种劳动者的血清胆固醇水平是否有差别?

作均数假设检验的步骤如下:

已知: X1 = 4.8 S1 = 0.72 n1=537 X2 = 4.6 S2 = 0.81 n2=643

1、建立假设和确定检验水准

H0:μ1=μ2(两种劳动者的血清胆固醇水平相同)

H1:μ1≠μ2(两种劳动者的血清胆固醇水平不同)

α= 0.05

2、计算统计量

U

U=

X1-X2

S22

n2

S12

n1

4.8-4.6

0.812

643

0.722

537

=4.488

3、确定P值 ∵│4.488│>1.96(U0.05值) ∴P<0.05 差别有意义---------

4、用文字表达检验结果

可以认为脑力劳动者血清胆固醇高于体力劳动者。

下列是含义相同且常用的其它文字描述方式,可以任意选择。

可以认为两种劳动者血清胆固醇水平不同。

可以认为劳动类型对血清胆固醇水平有影响。

两种劳动者血清胆固醇水平的差别有显著性。

两种劳动者血清胆固醇水平的差别有统计学意义。

样本均数与总体均数比较的假设检验

例:从大量调查得知,健康成年男性脉搏均数为72次/分钟(从大量调查中总结出来的均数,通常被认为是总体均数);调查某工厂100名成年男性工人脉搏的平均数为73.7次/分钟,标准差为8.8次/分钟。

已知μ=72;X=73.7、标准差S=8.8、n=100。

1、建立假设和确定检验水准

H0:μ=μ0 =72 (该厂男性工人与健康成年男性的脉搏相同)

H1:μ≠μ0 (该厂男性工人与健康成年男性的脉搏不同) α=0.05

U=

U=

X-μ

S X

73.7-72

8.8÷ 100

=1.932

3、确定P值 ∵│1.932│<1.96 ∴P>0.05 -----

4、用文字表达检验结果 可以认为该厂男性工人与健康男性的脉搏相同。

四格表卡方检验(X2检验)

例一:为比较两种治疗方法哪一种较好,某医师用甲药治疗患者25例,治愈率80%;用乙药治疗同类患者30例;治愈60%。问两种治疗效果的差别有无显著性?

1、列出统计分析表:

治疗情况

治愈人数

未愈人数

合计

治愈率

(%)

甲法

20(a)

5(b)

25

80.0

乙法

18(c)

12(d)

30

60.0

合计

38

17

55

2、判断资料是否适合作X2检验。

由于本例资料N=55>40;Tmin=7.73>5,可使用一般公式作四格表X2检验。

(二)卡方检验的步骤

1、建立假设和确定检验水准 H0: π1=π2 H1: π1≠π2 α=0.05

2、计算统计量

X

X2==

(ad-bc)2N

(a+b)(c+d)(a+c)(b+d)

(20×12-18×5)2×55

25×30×38×17

=2.55

3、确定P值 ∵X2<3.84 ∴P>0.05 差别无意义 --------

4、用文字表达检验结果 可以认为甲乙两种疗法的疗效相同。

也可以选择下面含义相同的其它文字描述方式。

甲乙两种疗法的疗效差别无显著性。

甲乙两种疗法的疗效差别无统计学意义。

例二:为比较两种疗法的治疗效果,对45名某病患者进行治疗,结果如下,问两药疗效是否相同?

疗法

治 疗

人 数

有 效

人 数

甲治疗法

27

22

乙治疗法

18

12

合计

45

34

统计分析:

22

5

27

12

6

18

34

11

45

Tmin=

Tmin= =4.4<5 且N>40 故用校正公式

11×18

4555

X2==(│ad-bc│-N÷2)2N(a+

X2==

(│ad-bc│-N÷2)2N

(a+b)(c+d)(a+c)(b+d)

(│22×6-12×5│-45÷2)2×45

27×18×34×11

=0.61

∵0.61<3.84 ∴P>0.05

可以认为两种治疗方法的效果相同。

统计学简答题总结

第六章 抽样与抽样分布

6.1 解释总体分布、样本分布和抽样分布的含义(或三种不同性质的分布)

总体分布:总体中各元素的观测值所形成的相对频数分布,称为总体分布。

样本分布:从总体中抽取一个容量为n的样本,由这n个观测值形成的相对频数分布,称为样本分布。

抽样分布:在重复选取样本量为n的样本时,由该样本统计量的所有可能取值形成的相对频数分布。

6.2 解释中心极限定理的含义

从均值为m、方差为s 2 的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≧30),样本均值的抽样分布近似服从均值为m、方差为s 2 /n 的正态分布。

重复抽样和不重复抽样相比,抽样均值抽样分布的标准差有何不同?

重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取个元素为止。

不重复抽样:一个元素被抽中后不再放回总体,而是从所剩元素中抽取第二个元素,直到抽取个元素为止。

样本均值的方差:

重复抽样

不重复抽样

样本均值的分布与总体分布的关系是什么?

样本均值与总体分布的关系:a无论是重复还是不重复抽样,样本均值的数学期望始终等于总体均值;b在重复抽样条件下,样本均值的方差为总体方差的1/n;在不重复抽样条件下,样本均值的方差为

样本方差和两个样本的方差比各服从什么分布?

对于来自正态总体的简单随机样本,则比值的抽样分布服从自由度为 的分布,即

两个样本方差比的抽样分布,服从分子自由度为(),分母自由度为() 的F分布,即

6.6 分布和F分布的图形各有什么特点?

分布的性质特点:

分布的变量值始终为正

分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称

期望为E()=n,方差为D()=2n(n为自由度)

可加性:若U和V为两个独立的服从c2分布的随机变量,U~ (),V~ (),则U+V这一随机变量服从自由度为+的分布

F分布图形的特点:

1、它是一种非对称分布;

  2、它有两个自由度,即n -1和m-1,相应的分布记为F( n –1, m-1), n –1通常称为分子自由度, m-1通常称为分母自由度;

  3、F分布是一个以自由度n –1和m-1为参数的分布族,不同的自由度决定了F 分布的形状。

4、F分布的倒数性质:Fα,df1,df2=1/F1-α,df2,df1

参数估计

解释估计量和估计值。

估计量:用来估计总体参数的统计量名称,用符号 表示

估计值:用来估计总体参数时计算出来的估计量的具体数值。

简述评价估计量好坏的标准

无偏性:指估计量抽样分布的数学期望等于被估计的总体参数。

有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。

一致性:指随着样本容量的增大,点估计量的值越来越接近被估总体的参数。

解释置信水平的含义。

将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 。

  表示为 (1 - 为是总体参数未在区间内的比例

怎样理解置信区间?

由样本统计量所构造的总体参数的估计区间,称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。

解释95%的置信区间。

有95%的区间包含了总体参数的真值,而5%则没有包含,则95%这个值被称为置信水平。

95%的置信区间指用某种方法构造的所有区间中有95%的区间包含总体参数的真值。

7.6 的含义是什么?

Za/2是标准正态分布上侧面积为a/2的z值

是估计总体均值时的边际误差,也称为估计误差或误差范围。

7.7 均值的置信区间估计和新观测值的预测区间估计有什么不同?

(1)预测随机变量未来的观察值,并希望求出各某个未来观察值的取值范围,这个范围就是对某个未来观察值的预测区间估计。

(2)未来观察值经标准化后服从标准正态分布,当用样本方差s2代替总体方差s2后,则服从t分布

7.8 解释独立样本和匹配样本的含义。

独立样本:如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立。

匹配样本:一个样本中的数据与另一个样本中的数据相对应。

7.9 在对两个总体均值之差的小样本估计中,对两个总体和样本都有哪些假定?

(1)、两个总体都服从正态分布

(2)、两个随即样本独立地分别抽自两个总体

简述样本容量与置信水平、总体方差、边际误差的关系。

样本容量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大;样本容量与总体方差成正比,总体的差异越大,所要求的样本容量也越大;样本容量与边际误差的平方成反比,即可以接受的边际误差的平方越大,所需的样本容量就越小。

假设检验(重点问题的答案)

解释原假设和备择假设。

原假设:研究者想收集证据予以反对的假设,表示为 H0

备择假设:研究者想收集证据予以支持的假设,表示为 H1

什么是标准化检验统计量?为什么要对统计量进行标准化?

根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。

怎样理解显著性水平?

显著性水平:假设检验中犯的第︱类错误的概率,记为a

分别列出大样本情形下总体均值左侧检验、右侧检验及双侧检验的拒绝域。

总体均值的检验(大样本检验方法的总结)

见书本P269

假设

双侧检验

左侧检验

右侧检验

假设形式

检验统计量

拒绝域

?

?

?

P值决策

分别列出小样本情形下总体均值左侧检验、右侧检验及双侧检验的拒绝域。

总体均值的检验 (小样本检验方法的总结)

见课本P270

假设

双侧检验

左侧检验

右侧检验

假设形式

检验统计量

拒绝域

?

?

?

P值决策

简述假设检验的一般步骤。

陈述原假设和备择假设

从所研究的总体中抽出一个随机样本

确定一个适当的检验统计量,并利用样本数据算出其具体数值

确定一个适当的显著性水平,并计算出其临界值,指定拒绝域

将统计量的值与临界值进行比较,作出决策

统计量的值落在拒绝域,拒绝H0,否则不拒绝H0

也可以直接利用P值作出决策

总结不同情形总体均值检验的基本程序。

第十三章 指数

解释指数的含义。

指数最早起源于测量物价的变动。

广义上,是指任何两个数值对比形成的相对数;

狭义上,是指用于测定多个项目在不同场合下综合变动的一种特殊相对数。实际应用中使用的主要是狭义的指数。

加权综合指数和加权平均指数有何区别与联系?

加权综合指数:通过加权来测定一组项目的综合变动,有加权数量指数和加权质量指数。使用条件:必须掌握全面数据(数量指数,测定一组项目的数量变动,如产品产量指数,商品销售量指数等)(质量指数,测定一组项目的质量变动,如价格指数、产品成本指数等)

拉式公式:将权数的各变量值固定在基期。

帕式公式:把作为权数的变量值固定在报告期。

加权平均指数:以某一时期的价值总量为权数对个体指数加权平均计算的指数。使用条件:可以是全面数据、不完全数据。因权数所属时期的不同,有不同的计算形式。有:算术平均形式、调和平均形式

13.3 解释零售价格指数、消费价格指数、生产价格指数、股票价格指数。

零售价格指数:反映城乡商品零售价格变动趋势的一种经济指数。

消费价格指数:反映一定时期内消费者所购买的生活消费品价格和服务项目价格的变动趋势和程度的一种相对数。

生产价格指数: 测量在初级市场上出售的货物(即在非零售市场上首次购买某种商品时) 的价格变动的一种价格指数。

股票价格指数:反映某一股票市场上多种股票价格变动趋势的一种相对数,简称股价指数。其单位一般用“点”(point)表示,即将基期指数作为100,每上升或下降一个单位称为“1点”。

消费者价格指数有哪些作用?

消费价格指数除了能反映城乡居民所购买的生活消费品价格和服务项目价格的变动趋势和程度外,还具有以下几个方面的作用:

(1)用于反映通货膨胀状况

(2)用于反映货币购买力变动

(3)用于反映对职工实际工资的影响

(4)用于缩减经济序列

13.5 在构建多指标综合评价指数时,指标的转换方法有哪几种形式?

有以下3种形式:

(1)统计标准化。

(2)极值标准化。

(3)定基与环比转换

推荐访问:统计 统计 例题 简答题 统计例题及统计简答题