3986.net
小网站 大容量 大智慧
相关标签
当前位置:首页 >> 数学 >>

3.2独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)


3.2 独立性检验的基本思想及其初步应用

新课

对于性别变量 , 其取值为男和女两种 .这 种变量的不同 " 值" 表示个体所属的不同 类 别 , 像这类变量称为 分类变量 .在现实 生活中, 分类变量是大量存在的 , 例如 是 否吸烟 ,宗教信仰 ,国籍, 等等. 在日常生活中 , 我们常常关心两个分类 变 量之间是否有关系 .例如, 吸烟与肺癌是否 有关系? 性 别对于是否喜欢数学课 程 有 影响? 等等.

两种变量:
?定量变量:体重、身高、温度、考试成绩等等。 ? 变量 ?分类变量:性别、是否吸烟、是否患肺癌、 ? 宗教信仰、国籍等等。 ?
在日常生活中,我们常常关心分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响等等?

研究两个变量的相关关系:
?定量变量——回归分析(画散点图、相关系数r、 ? 变量 ? 相关指数R 2、残差分析) ?分类变量—— 独立性检验 ?

本节研究的是两个分类变量的独立性检验问题。

探究

列联表

为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人)
吸烟与肺癌列联表
不患肺癌 患肺癌 总计

不吸烟
吸烟 总计

7775
2099 9874

42
49 91

7817
2148 9965

在不吸烟者中患肺癌的比例是 0.54% 在吸烟者中患肺癌的比例是 2.28%
说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患 肺癌的可能性大。

通过图形直观判断两个分类变量是否相关: 1、列联表 2、等高条形图
不吸烟 吸烟 总计 不患肺癌 7775 2099 9874 患肺癌 42 49 91 总计 7817 2148 9965

等高条形图更清晰地表达了两种情况下患肺癌的比例。

上面我们通过分析数据和图形,得到的直观印象是吸烟和 患肺癌有关,那么事实是否真的如此呢?这需要用统计观点 来考察这个问题。

现在想要知道能够以多大的把握认为“吸烟与患肺癌有关”, 为此先假设

H0:吸烟与患肺癌没有关系.

H0:吸烟与患肺癌没有关系.
不吸烟 吸烟 总计 不患肺癌 a c a+c 患肺癌 b d b+d 总计 a+b c+d a+b+c+d

如果吸烟与患肺癌没有关系,则:

a c ? a?b c?d

a(c+d)≈c(a+b)

ad-bc≈0

因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强。

独立性检验
为了使不同样本容量的数据有统一的评判标准,基于上述分 析,我们构造一个随机变量-----卡方统计量

n(ad ? bc) K ? , (1) (a ? b)(c ? d )(a ? c)(b ? d )
2 2

其中n ? a ? b ? c ? d为样本容量。
根据表3-7中的数据,利用公式(1)计算得到K2的观测值为:

若 H0成立,即“吸烟与患肺癌没有关系”,则K2应很小。

9965(7775 ? 49 ? 42 ? 2099) k? ? 56.632 7817 ? 2148 ? 9874 ? 91
2

( 2)

那么这个值到底能告诉我们什么呢?

在H0成立的情况下,统计学家估算出如下的概率

即在 H0 成立的情况下, K2 的值大于 6.635 的概率非常小,近似 于0.01。

P( K 2 ? 6.635) ? 0.01.

(2)

也就是说,在H0成立的情况下,对随机变量 K2进行多次观 测,观测值超过6.635的频率约为0.01。

思考
如果K 2 ? 6.635,就断定H0不成立,这种判断出错的可能性有多大 ?

答:判断出错的概率为0.01

9965(7775 ? 49 ? 42 ? 2099 )2 现在观测值k ? ? 56.632太大了, 7817 ? 2148 ? 9874 ? 91 在H 0成立的情况下能够出现这样的观测值的概率不超过0.01, 因此我们有99%的把握认为H 0不成立,即有99%的把握认为“吸烟 与患肺癌有关系”。

判断 H 0是否成立的规则
如果 k ? 6.635 ,就判断 H 0 不成立,即认为吸烟与 患肺癌有关系;否则,就判断 H 0 成立,即认为吸烟 与患肺癌有关系。

H0 在该规则下,把结论“H 0 成立”错判成“ P( K 2 ? 6.635) ? 0.01, 成立”的概率不会差过 即有99%的把握认为 H 0不成立。



独立性检验的定义
上面这种利用随机变量K2来确定在多大程度上 可以认为“两个分类变量有关系”的方法,称为两 个分类变量的独立性检验。

独立性检验的基本思想(类似反证法)
(1)假设结论不成立,即 H0 : “两个分类变量没有关系”. (2)在此假设下我们所构造的随机变量 K2 应该很小,如果由 观测数据计算得到K2的观测值k很大,则在一定可信程度上 说明 H 0 不成立.即在一定可信程度上认为“两个分类变量 有关系”;如果k的值很小,则说明由样本观测数据没有发现 反对 H 0 的充分证据。
(3)根据随机变量K2的含义,可以通过评价该假设不合理的 程度,由实际计算出的,说明假设合理的程度为99%,即“两 个分类变量有关系”这一结论成立的可信度为约为99%.

具体作法是: (1)根据实际问题需要的可信程度确定临界值 k0; (2)利用公式(1),由观测数据计算得到随机变量 K 2 的观测值; (3)如果 k ? k0 ,就以 (1 ? P( K ? k0 )) ?100%的把握认为“X 与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系” 的充分证据。
2

在实际应用中,要在获取样本数据之前通过下表确定临界值:
P(K2 ? k0 ) 0.50

k0 k0

0.40 0.25 0.15 0.455 0.708 1.323 2.072 0.025 0.010 0.005 3.841 5.024 6.636 7.879

0.10 2.706 0.001 10.828

P(K2 ? k0 ) 0.05

P( K 2 ? k )

0.50 0.455

0.40 0.708

0.25 1.323

0.15 2.072

0.10 2.706

0.05 3.841

0.025 5.024

0.010 6.635

0.005 7.879

0.001 10.828

k

(1)如果k ? 10.828, 就有99.9%的把握认为" X 与Y 有关系" (2)如果k ? 7.879, 就有99.5%的把握认为" X 与Y 有关系" (3)如果k ? 6.635, 就有99%的把握认为" X 与Y 有关系" (4)如果k ? 5.024, 就有97.5%的把握认为" X 与Y 有关系" (5)如果k ? 3.841, 就有95%的把握认为" X 与Y 有关系" (6)如果k ? 2.706, 就有90%的把握认为" X 与Y 有关系" (7)如果k ? 2.706, 就认为没有充分的证据显示 " X 与Y
有关系"

上面这种利用随机变量K2来确定在多大程度上 可以认为”两个分类变量有关系”的方法称为两个 分类变量的独立性检验 独立性检验的基本思想类似于数学上的反证法. 要确认”两个分类变量有关系”这一结论成立 的可信程度,首先假设该结论不成立,即假设结 论”两个分类变量没有关系”成立.在该假设下 我们构造的随机变量K2应该很小,如果由观测数 据计算得到的K2的观测值k很大,则在一定程度 上说明假设不合理.

一般地, 假设有两个分类变量X 和Y , 它们的值域分别为 {x1 , x2 }和{ y1 , y2 }, 其样本频数列联表(称为2 ? 2列联表)为 : y2 y1 总计 x1 a b a+b x2 c d c+d
总计 a+c b+d a+b+c+d

若要推断的结论为H1:”X与Y有关系”,可如下操作: 1.通过等高条形图,可以粗略地判断两个变量是否有 关系,但是这种判断不精确.

2.利用独立性检验来考察两个分类变量是否有关系, 并且能较精确地给出这种判断的可靠程度. 具体做法是: 根据观测数据计算由

n ? ad ? bc ? K ? ? a ? b ?? c ? d ?? a ? c ?? b ? d ?
2 2

其中n ? a ? b ? c ? d为样本容量

给出的随机变量K2的值k,其值越大,说明”X与Y有关系” 成立的可能性越大.当得到的观测数据a,b,c,d都不小于 5时,可以通过查表来断言”X与Y有关系”的可信程度

例2.在某医院,因为患心脏病而住院的665名男性病人中,有214 人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有 175人秃顶 (1)利用图形判断秃顶与患心脏病是否有关系 (2)能否在犯错误的概率不超过0.01的前提下认为秃顶和患心 脏病有关系? 解:根据已知数据,得出如下列联表

秃顶

患心脏病 214

不患心脏病 175
597 772

总计 389
1048 1437

不秃顶 451 665 总计

秃顶患者中患心脏病的比例为0.55 不秃顶患者中患心脏病的比例为0.43

(1)由等高条形图显示, 秃顶样本中患心脏病的频 率明显高于不秃顶样本 中患心脏病的频率 因此可以认为秃顶和患心 脏病有关系

(2)K2=16.373>6.635
因此,在犯错误概率不超过0.010的前提下,认 为秃头与心脏病有关.

课堂练习 练P83 例2


推荐相关:

...3配套练习:3.2 独立性检验的基本思想及其初步应用

【志鸿优化】人教A版高中数学选修2-3配套练习:3.2 独立性检验的基本思想及其初步应用_高中教育_教育专区。【志鸿优化】人教A版高中数学选修2-3配套练习:3.2 独...


3.2 独立性检验的基本思想及其初步应用 学案(人教A版选...

3.2 独立性检验的基本思想及其初步应用 学案(人教A版选修2-3) (1)_数学_高中教育_教育专区。数学基础模块 上册 1.1.1 集合的概念【教学目标】 1. 初步...


...3教学设计:3.2 独立性检验的基本思想及其初步应用

高中数学(人教版)选修2-3教学设计:3.2 独立性检验的基本思想及其初步应用_数学_高中教育_教育专区。高中数学(人教版)选修2-3教学设计 ...


...年高中数学 3.2独立性检验的基本思想及其初步应用课...

2015-2016学年高中数学 3.2独立性检验的基本思想及其初步应用课后训练 新人教A版选修2-3_数学_高中教育_教育专区。2015-2016 学年高中数学 3.2 独立性检验的...


...3学案:3.2独立性检验的基本思想及其初步应用

高中数学(人教版)选修2-3学案:3.2独立性检验的基本思想及其初步应用_数学_高中教育_教育专区。高中数学(人教版)选修2-3学案 3.2 独立性检验的基本思想及其初步...


...3.2《独立性检验的基本思想及其初步应用》

高中数学人教版选修2-3同步练习:3.2独立性检验的基本思想及其初步应用》_数学_高中教育_教育专区。高中数学人教版选修2-3同步练习 ...


...年高中数学 3.2独立性检验的基本思想及其初步应用课...

2015-2016学年高中数学 3.2独立性检验的基本思想及其初步应用课时作业 新人教A版选修2-3_数学_高中教育_教育专区。2015-2016 学年高中数学 3.2 独立性检验的...


...:3-2 独立性检验的基本思想及其初步应用

高中数学(新人教A版选修2-3)课后巩固 :3-2 独立性检验的基本思想及其初步应用_数学_高中教育_教育专区。高中数学(新人教A版选修2-3)课后巩固 ...


...年高中数学 3.2独立性检验的基本思想及其初步应用学...

2015-2016学年高中数学 3.2独立性检验的基本思想及其初步应用学案 新人教A版选修2-3_数学_高中教育_教育专区。2015-2016 学年高中数学 3.2 独立性检验的基本...


...3.2独立性检验的基本思想及其初步应用(同

数学:新人教A版选修2-3 3.2独立性检验的基本思想及其初步应用(同_数学_高中教育_教育专区。学而思网校 www.xueersi.com 高中新课标选修(2-3)3.2 测试题一、...

网站首页 | 网站地图
3986 3986.net
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@qq.com