3986.net
小网站 大容量 大智慧
赞助商链接
当前位置:首页 >> 数学 >>

高中数学《1.2独立性检验的基本思想及其初步应用》ppt课件6


1.2 独立性检验的基本思想及其初步应用

【课标要求】 1.了解独立性检验的基本思想、方法及其简单应用;

2.理解判断两个分类变量是否有关系的常用方法、独立性检
验中K2的含义及其实施步骤. 【核心扫描】 1.能够根据题目所给数据列出列联表及求K2.(重点) 2.独立性检验的基本思想和方法.(难点)

自学导引 1.分类变量和列联表

(1)分类变量
变量的不同“值”表示个体所属的 不同类别 ,像这样的变 量称为分类变量. (2)列联表 ①定义:列出的两个分类变量的 频数表 ,称为列联表.

②2×2列联表

一般地,假设两个分类变量X和Y,它们的取值分别为
{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为 y1 x1 x2 a c y2 b d 总计 a+b c+d

总计 a+c b+d a+b+c+d

想一想:如何理解分类变量? 提示 (1)这里的“变量”和“值”都应作为“广义”的变量和值

来理解.例如:对于性别变量,其取值有 “男”和“女”两种,
这里的 “ 变量 ”指的是“ 性别 ”,这里的 “值 ” 指的是 “男 ” 或 “女”. 因此,这里说的 “变量” 和“ 值”不一定是取具体的数 值. (2)分类变量是大量存在的.例如:吸烟变量有吸烟与不吸烟两种

类别,而国籍变量则有多种类别.

2.独立性检验
定义 利用随机变量 K2 来判断“两个分类变量 有关系”的方法称为独立性检验

2 n ? ad - bc ? K2= , ? a + b ?? c + d ?? a + c ?? b + d ? 公式

其中 n=

a+b+c+d

①根据实际问题的需要,确定容许推断“两个分类变量有 关系”犯错误概率的上界α.然后查表确定 临界值k0 . 具体 步骤 ②利用公式计算随机变量K2的 观测值k . ③如果 k≥k0 ,就推断“X与Y有关系”,这种推

断 犯错误的概率不超过α,否则就认为在犯错误的概率不
超过α的前提下不能推断“X与Y有关系”,或者在样本数 据中 没有发现足够证据 支持结论“X与Y有关系”

3.独立性检验临界值表 P(K2 0.50 ≥k0) 0.0 0.0 0.40 0.25 0.15 0.10 0.05 0.025 0.010 05 01 10. 7.8 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 82 79 8

k0

想一想: 在 K2 运算时,在判断变量相关时,若 K2 的观测值 k = 56.632,则P(K2≥6.635)≈0.01和P(K2≥10.828)≈0.001,哪种说法是正

确的?
提示 两种说法均正确. P(K2≥6.635)≈0.01 的含义是在犯错误的概率不超过 0.01 的前提下, 认为两变量相关; 而P(K2≥10.828)≈0.001的含义是在犯错误的概率不超过0.001的前提

下,认为两变量相关.

名师点睛 1.在2×2列联表中,如果两个分类变量没有关系,则应满足ad-

bc≈0 ,因此 |ad - bc| 越小,关系越弱; |ad - bc| 越大,关系越
强.

2.独立性检验的基本思想
(1)独立性检验的基本思想类似于数学中的反证法,要确认“两 个分类变量有关系”这一结论成立的可信程度,首先假设该结 论不成立,即假设结论“两个分类变量没有关系”成立,在该 假设下我们构造的随机变量K2应该很小,如果由观测数据计算

得到的K2的观测值很大,则在一定程度上说明假设不合理,根
据随机变量 K2 的含义,可以通过 P(K2≥6.635)≈0.01 来评价假设 不合理的程度,由实际计算出 k2≥6.635,说明假设不合理的程 度约为99%,即“两个分类变量有关系”这一结论成立的可信 程度约为99%.

(2)在实际问题中要记住以下几个常用值:

①k>6.635有99%的把握认为“X与Y有关系”;
②k>3.841有95%的把握认为“X与Y有关系”; ③k>2.706有90%的把握认为“X与Y有关系”; ④k≤2.706就认为没有充分证据显示“X与Y有关系”. (3)反证法原理与独立性检验原理的比较

反证法原理:在假设 H0下,如果推出一个矛盾,就证明了H0不成
立. 独立性检验原理:在假设 H0 下,如果出现一个与H0相矛盾的小概 率事件,就推断H0不成立,且该推断犯错误的概率不超过这个小 概率.

3.两个分类变量相关性检验方法 利用独立性检验来考察两个分类变量是否有关系,能较精确地

给出这种判断的可靠程度,具体的做法是:①根据实际问题的
需要确定容许推断“两个分类变量有关系”犯错误概率的上界 α,然后查表确定临界值k0.②计算随机变量K2的观测值k.③如果 k≥k0,就推断“X与Y”有关系,这种推断犯错误的概率不超过 α,否则就认为在犯错误的概率不超过α的前提下不能推断“X

与Y有关系”,或者在样本数据中没有发现足够证据支持结论
“X与Y有关系”.

题型一 有关“相关的检验”

【例1】 某校对学生课外活动进行调查,结果整理成下表:
试用你所学过的知识进行分析,能否在犯错误的概率不超过 0.005的前提下,认为“喜欢体育还是文娱与性别有关系”? 体育 文娱 总计 男生 女生 总计 21 6 27 23 29 52 44 35 79

[思路探索] 可用数据计算 K2,再确定其中的具体关系. 解 判断方法如下: 假设 H0“喜欢体育还是喜欢文娱与性别没有关系”,若 H0 成立, 则 K2 应该很小. ∵a=21,b=23,c=6,d=29,n=79, n?ad-bc?2 ∴k= ?a+b??c+d??a+c??b+d? 79×?21×29-23×6?2 = ≈8.106. ?21+23?×?6+29?×?21+6?×?23+29?

且P(K2≥7.879)≈0.005即我们得到的K2的观测值k≈8.106超过7.879,

这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成
立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认 为“喜欢体育还是喜欢文娱与性别有关”.

规律方法

2 n ? ad - bc ? (1)利用 K2= 求出 K2 的观测值 ?a+b??c+d??a+c??b+d?

k 的值.再利用临界值的大小来判断假设是否成立. (2)解题时应注意准确代数与计算,不可错用公式,准确进行比较 与判断.

【变式1】 为研究学生的数学成绩与对学习数学的兴趣是否有关, 对某年级学生作调查得到如下数据: 成绩优秀 成绩较差 总计 兴趣浓厚的 兴趣不浓厚的 总计 64 22 86 30 73 103 94 95 189

判断学生的数学成绩好坏与对学习数学的兴趣是否有关?



由公式得 K2 的观测值

189×?64×73-22×30?2 k= ≈38.459. 86×103×95×94 ∵38.459>10.828,∴有 99.9%的把握说学生学习数学的兴趣与数 学成绩是有关的.

题型二 有关“无关的检验” 【例2】 为了探究学生选报文、理科是否与对外语的兴趣有关,某 同学调查了361名高二在校学生,调查结果如下:理科对外语 有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有

73人,无兴趣的有52人.试分析学生选报文、理科与对外语的
兴趣是否有关? [思路探索] 要在选报文、理科与对外语有无兴趣之间有无关系 作出判断,可以运用独立性检验的方法进行判断.

解 列出2×2列联表 理 文 总计 211 150

有兴趣 138 73 无兴趣 98 52

总计
代入公式得 K2 的观测值

236 125 361

361×?138×52-73×98?2 - k= ≈1.871×10 4. 236×125×211×150 ∵1.871×10 4<2.706,∴可以认为学生选报文、理科与对外语的


兴趣无关.

规律方法 运用独立性检验的方法: (1)列出2×2列联表,根据公式计算K2的观测值k.

(2)比较k与k0的大小作出结论.

【变式2】 某教育机构为了研究人具有大学专科以上学历(包括大 学专科)和对待教育改革态度的关系,随机抽取了392名成年 人进行调查,所得数据如下表所示:

支持教育改
革情况 学历 大学专科 以上学历

积极支持 不太赞成 教育改革 教育改革 39 29 68 157 167 324

总计

196 196 392

大学专科
以下学历 总计

对于教育机构的研究项目,根据上述数据能得出什么结论.



根据列联表给出的数据,可计算出 K2 的观测值

392×?39×167-29×157?2 k= ≈1.78, 196×196×68×324 因为 1.78<2.706,所以我们没有充分理由说“人具有大学专科以 上学历(包括大学专科)和对待教育改革的态度有关”.

题型三 独立性检验的基本思想

【例3】 某企业有两个分厂生产某种零件,按规定内径尺寸(单位: mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产 的零件中各抽出500件,量其内径尺寸,结果如下表:

甲厂
[30.0 [30.1 分组 [29.86, [29.90, [29.94, [29.98, [30.02, 6, 10) 频数 12 63 86 182 92 61 0, 14) 4

29.90) 29.94) 29.98) 30.02) 30.06) 30. 30.

乙厂
[30. [30. 06 10 [29.86, [29.90, [29.94, [29.98, [30.02, , , 分组 29.90) 29.94) 29.98) 30.02) 30.06) 30 30 . . 10) 14) 29 71 85 159 76 62 18 频数

(1)试分别估计两个分厂生产的零件的优质品率;

(2) 由以上统计数据填下面 2×2列联表,并问是否有 99% 的把握认
为“两个分厂生产的零件的质量有差异”. 甲厂 乙厂 总计 优质品 非优质品 总 计

2 n ? ad - bc ? 附:K2= , ?a+b??c+d??a+c??b+d?

P(K2≥k0) k0

0.05

0.01

3.841 6.635

(1)分别计算甲、 乙两厂优质品的频数与 500 的比值即为 所求. (2)根据已知数据填充 2×2 列联表,进行独立性检验.

[规范解答] (1)甲厂抽查的产品中有 360 件优质品,从而甲厂生产 360 的零件的优质品率估计为500=72%; (2 分)

乙厂抽查的产品中有 320 件优质品,从而乙厂生产的零件的优质 320 品率估计为 =64%. 500 (4 分)

(2) 甲厂 乙厂 总计 优质品 非优质品 总计 360 140 500 320 180 500 680 320 1 000 (8 分) 1 000×?360×180-320×140?2 k= ≈7.353>6.635, 500×500×680×320 (10 分)

所以有 99%的把握认为“两个分厂生产的零件的质量有差异”. (12 分)

【 题 后 反 思 】 (1) 解 答 此 类 题 目 的 关 键 在 于 正 确 利 用 K2 = n?ad-bc?2 计算 k 的值, 再用它与临界值的大小作比 ?a+b??c+d??a+c??b+d? 较来判断假设检验是否成立,从而使问题得到解决. (2)此类题目规律性强, 解题比较格式化, 填表计算分析比较即可, 要熟悉其计算流程,不难理解掌握.

【变式3】 下表是某地区的一种传染病与饮用水的调查表: 得病 不得病 总计
干净水 52 466 518

不干净水
总计

94
146

218
684

312
830

(1)这种传染病是否与饮用水的卫生程度有关, 请说明理由; (2)若饮用干净水得病 5人,不得病50人,饮用不干净水得病9 人,不得病 22 人.按此样本数据分析这种疾病是否与饮用水

有关,并比较两种样本在反映总体时的差异.

解 (1)假设 H0:传染病与饮用水无关.把表中数据代入公式得:
2 830 × ? 52 × 218 - 466 × 94 ? K2 的观测值 k= ≈54.21, 146×684×518×312

∵54.21>10.828,所以拒绝 H0. 因此我们有 99.9%的把握认为该地区这种传染病与饮用不干净水 有关. (2)依题意得 2×2 列联表:

得病
干净水 不干净水 总计 5 9 14

不得病
50 22 72

总计
55 31 86

2 86 × ? 5 × 22 - 50 × 9 ? 此时,K2 的观测值 k= ≈5.785. 14×72×55×31

由于 5.785>5.024 所以我们有 97.5%的把握认为该种疾病与饮用不干净水有关. 两个样本都能统计得到传染病与饮用不干净水有关这一相同结 论,但(1)中我们有 99.9%的把握肯定结论的正确性,(2)中我们只 有 97.5%的把握肯定.

误区警示 因未理解P(K2≥k0)的含义而致错 【示例】 某小学对232名小学生调查中发现:180名男生中有98名 有多动症,另外82名没有多动症,52名女生中有2名有多动症, 另外50 名没有多动症,用独立性检验方法判断多动症与性别 是否有关系?

[错解] 由题目数据列出如下列联表:
多动症 无多动症 总计

男生
女生 总计

98
2 100

82
50 132

180
52 232

232×?98×50-2×82?2 k= ≈42.117>10.828. 100×132×180×52 所以有 0.1%的把握认为多动症与性别有关系. 应 该 是 有 (1 - P(K2≥10.828))×100% = (1 - 0.001)×100% 的 把 握 , 而 不 是 0.001×100%的把握. P(K2≥10.828)×100% =

[正解] 由题目数据列出如下列联表: 多动症 无多动症 总计 男生 女生 总计 由表中数据可得到: 232×?98×50-2×82?2 k= ≈42.117>10.828. 100×132×180×52 所以有 99.9%的把握认为多动症与性别有关系. 98 2 100 82 50 132 180 52 232

本题的错误之处在于不能正确理解独立性检验步骤的含

义,当计算的K2的观测值k大于临界值k0时,就可推断在犯错误的
概率不超过α的前提下说X与Y有关系,这一点需牢记.



推荐相关:

...2:第一章 1.2 独立性检验的基本思想及其初步应用 含...

2018高中数学人教a版选修1-2:第一章 1.2 独立性检验的基本思想及其初步应用 ...5.02 6.63 7.87 10.8 k0 1 4 5 9 28 A.k>6.635 C.k>7.879 ...


1.2 独立性检验的基本思想及其初步应用《云师大“1+1”...

搜试试 7 帮助 全部 DOC PPT TXT PDF XLS 百度文库 教育专区 高中教育 其它...1.2 独立性检验的基本思想及其初步应用《云师大“1+1”专业数学辅导》_其它...


高中数学1.2独立性检验的基本思想及其初步应用课后反思...

搜试试 3 悬赏文档 全部 DOC PPT TXT PDF XLS ...高中数学1.2独立性检验的基本思想及其初步应用课后...高中数学3.2独立性检验的... 0人阅读 6页 ...


...统计案例 1.2独立性检验的基本思想及其初步应用课时...

搜试试 3 帮助 全部 DOC PPT TXT PDF XLS ...1.2独立性检验的基本思想及其初步应用课时作业_数学...520 名女人中有 6 名患色盲,试利用图 形来判断...


1.2 独立性检验的基本思想及其初步应用 学案(人教A版选...

1.2 独立性检验的基本思想及其初步应用 学案(人教A版选修1-2)[1]_高二数学...(2)在实际问题中要记住以下几个常用值: ①k>6.635 有 99%的把握认为“X...


高中数学《1.2 独立性检验的基本思想及其初步应用》导...

搜 试试 帮助 全部 DOC PPT TXT PDF XLS ...6页 免费如要投诉违规内容,请到百度文库投诉中心;如...高中数学《1.2 独立性检验的基本思想及其初步应用》...


...A版选修1-2 独立性检验的基本思想及其初步应用 学案...

搜试试 3 悬赏文档 全部 DOC PPT TXT PDF XLS ...2 独立性检验的基本思想及其初步应用 学案_高二数学...k0 0.05 3.841 0.025 5.024 0.010 6.635 0...


3.2.1《独立性检验的基本思想及其初步应用》教学设计

3.2.1《独立性检验的基本思想及其初步应用》教学设计_高二数学_数学_高中教育_...2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.897 0.001 ...


《3.2独立性检验的基本思想及其初步应用》教学案1

《3.2独立性检验的基本思想及其初步应用》教学案1_高三数学_数学_高中教育_...2.706 0.05 3.84 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10...


...高中数学 1.2 独立性检验的基本思想及其初步应用课...

【全程复习14-2015学年高中数学 1.2 独立性检验的基本思想及其初步应用课堂达标效果检测 新人教A版选修1-2_高二数学_数学_高中教育_教育专区。" 【全程复习方略...

网站首页 | 网站地图
3986 3986.net
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@qq.com