3986.net
小网站 大容量 大智慧
当前位置:首页 >> 数学 >>

高中数学选修2-3统计案例之变量间的相关关系与统计案例


第九单元 统计、统计案例、算法初步

第三节 变量间的相关关系与统计案例

知识汇合
1.两个变量间的相关关系:变量间确实存在关系,但又不

随机性 确定性 具备函数所要求的________,它们的关系是带有________的.
2.散点图:将 n 个数据点(xj,yj)(j=1,2,?,n)描在平面直

相关关系 角坐标系中,以表示具有__________的两个变量的一组数据的图
形.

3.正(负)相关:从散点图可以看到点散布的位置是从 右上角 左下角 ________到________,这种相关称为正相关;反之,如果两个

左上角 右下角 变量的散点图点散布的位置是从________到________的区域,
则为负相关. 4.回归直线:观察散点图的特征,发现各点大致分布 在一条直线的附近 ________________,这条直线叫回归直线.

2. 回归直线方程 (1)直线方程 叫做y对x的 回归直线方程 ,b叫 做 回归系数 .要确定回归直线方程,只需确定a与回归系数b. (2)用最小二乘法求回归直线系数a,b有下面的公式:

?xiyi-n x y
i=1

n

^=a+bx y ^ ^
其中a,b的上方加“^”,表示是由观察值按

^ b= x2-n x 2 ?i
i=1 n

^ ^ ,a= y -b x .

估计值 最小二乘法求得的 叫 .

^ , b

也回归系数

3. 回归分析 ^ ^ ^ (1)回归直线方程y=bx+a,其中:
n n

? ?xi- x ??yi- y ? ?xiyi-n x
^ b=
i=1 i=1

y ,



? ?xi- x ?2
i=1

n

?xi2-n x
i=1

n

2

1n 1n ^ ^ a= y -b x ( x = ?xi, y = ?yi). ni=1 ni=1 (2)样本相关系数

? ?xi- x ??yi- y ?
i=1

n

r=

? ?xi- x ? · ?yj- y ?2 ?
2 i=1 n j=1

n

n

?xiyi-n x
i=1

y .
n


n 2 i=1 j=1

? ?x2i-n x ?? ? ?y2i-n y 2? j

(3)样本相关系数r具有以下性质:|r|≤1,并且|r|越接近1,线性相关程度越强; 越弱 |r|越接近0,线性相关程度 .
4. 独立性检验 为分类变量. (2)列联表:列出的两个分类变量的 频数表 称为列联表.假设有两个分类变量 X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为

不同类别 (1)分类变量:变量的不同“值”表示个体所属的

,像这类变量称

2×2列联表)为2×2列联表

y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d n?ad-bc?2 构造一个随机变量K2= , ?a+b??c+d??a+c??b+d? a+b+c+d 其中n= 为样本容量.

典例分析
考点一 利用散点图判断两个变量的相关性 【例1】 山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田 上进行某棉花品种施化肥量x对产量y影响的试验,得到如下表所示的一组数 据(单位:kg). 施化肥量x 15 20 25 30 35 40 45 (1)画出散点图; 棉花产量y 330 345 365 405 445 450 455 (2)判断是否具有相关关系. 解 (1)散点图如图所示:

(2)由散点图可知各组数据对应点大致都在一条直线附近,所以施化肥量x与 产量y具有线性相关关系.

点拨 散点图是由大量数据点分布构成的,是定义在具有相关关系的两个变量基础之 上的,对于性质不明确的两组数据,可先作散点图,直观地分析它们有无关系 及关系的密切程度. 考点二 求回归直线方程 【例2】 随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究 某市家庭月平均收入与月平均生活支出的关系,该市统计部门随机调查10个家 庭,得数据如下:
家庭编号 xi(收入) 千元 yi(支出) 千元 1 0.8 0.7 2 1.1 1.0 3 1.3 1.2 4 1.5 1.0 5 1.5 1.3 6 1.8 1.5 7 2.0 1.3 8 2.2 1.7 9 2.4 2.0 10 2.8 2.5

(1)判断家庭月平均收入与月平均生活支出是否相关? (2)若二者线性相关,求回归直线方程.

解 (1)作出散点图:

观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系.
观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系. 1 (2) x = (0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74, 10 1 y = (0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42, 10

?xiyi-n x
^ b=
i=1

n

y ≈0.813 6,

?x2i-n x
i=1

n

2

^ a=1.42-1.74×0.813 6≈0.004 3, ^ ∴回归方程为y =0.813 6x+0.004 3.

点拨 求回归直线方程,关键在于正确求出系数a,b,由于计算量较大,所以计算时要 仔细谨慎,分层进行,避免因计算产生失误,特别注意,只有在散点图大体呈 线性时,求出的回归直线方程才有意义.

考点三 线性回归分析 【例3】 假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有 如下统计资料:
x y 2 2.2 3 3.8 4 5.5 5 6.5 6 7.0

已知 ?x2i=90, ?y2i=140.78, ?xiyi=112.3,
i=1 i=1 i=1

5

5

5

79≈8.9, 2≈1.4,n-2=3 时,r0.05=0.878. (1)求 x , y ; (2)如果 x 与 y 具有线性相关关系,求出线性回归方程; (3)估计使用年限为 10 年时,维修费用约是多少?
2+3+4+5+6 2.2+3.8+5.5+6.5+7.0 解 (1) x = =4. y = =5. 5 5

?x y -5 x
i i i =1

5

y
= 112.3-5×4×5 =1.23, 2 90-5×4

(2)判断变量 x,y 之间具有相关关系.b=

?x2i-5? x ?
i =1

5

2

^ ^ a= y -b x =5-1.23×4=0.08. ^ 所以线性回归方程为y =1.23x+0.08. ^ (3)当 x=10 时,y =1.23×10+0.08=12.38(万元), 即估计使用 10 年时,维修费用约为 12.38 万元.

点拨 在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线 性相关关系,若它们之间具有相关关系,再求回归方程;否则,即使求出回归方 程也是毫无意义的,而且用其估计和预测的量也是不可信的.

考点四 独立性检验 【例4】 在调查的480名男人中有38名患有色盲,520名女人中有6名患有 色盲,利用独立性检验的方法来判断色盲与性别是否有关?你所得到的结论 在什么范围内有效? 解 根据题目所给的数据作出如下的列联表:

男 女 合计

色盲 38 6 44

不色盲 442 514 956

合计 480 520 1 000

根据列联表中所给的数据有 1 000×?38×514-6×442? 2 K2= ≈27.1. 480×520×44×956 因为 27.1>10.828,所以我们有 99.9%的把握认为色盲与性别是有关的.

点拨 独立性检验的一般步骤:? (1)根据样本数据制成2×2列联表; (2)根据公式 (3)查表比较K2与临界值的大小关系,作统计判断. 计算K2的值;

高考体验
本节主要内容是变量的相关性及其几种常见的统计方法.在高考中主要是以 考查独立性检验、回归分析为主,并借助解决一些简单的实际问题来考查一 些基本的统计思想. 在高考中多为选择题、填空题,也有可能出现解答题,都为中低档题.

(2012 年高考湖南卷理科 4)设某大学的女生体重 y (单位: kg) 与身高 x(单位:cm)具有线性相关关系,根据一组样本数据 (xi,yi) (i=1,2,?,n) ,用最小二乘法建立的回归方程为
? =0.85x-85.71,则下列结论中不正确的是( y



A.y 与 x 具有正的线性相关关系 B.回归直线过样本点的中心( x , y ) C.若该大学某女生身高增加 1cm,则 其体重约增加 0.85kg D. 若 该 大 学 某 女 生 身 高 为 170cm, 则 可 断 定 其 体 重 比 为 58.79kg

练习巩固
1. 在吸烟与患肺癌这两个分类变量的计算中,下列说法正确的是( ) A. 若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺癌有关系, 那么在100个吸烟的人中必有99人患有肺癌 B. 从独立性检验可知有99%的把握认为吸烟与患肺癌有关系时,我们说某人 吸烟,那么他一定有99%的可能患有肺癌 C. 若从统计量中求出有95%的把握认为吸烟与患肺癌有关系,是指有5%的 可能性使得推断出现错误 D. 以上三种说法都不正确 解析:统计结果仅说明事件发生的概率的大小,而具体到某个个体却不一

定发生.
答案:C

2. 下列选项中,两个变量有相关关系的是( A. 正方形的面积与周长 B. 匀速行驶车辆的行驶路程与时间 C. 人的身高与体重 D. 人的身高与视力

)

解析:A、B中的两个变量是函数关系,D中的两个变量不具有任何关系,C 中人的身高与体重有相关关系,故应选C. 答案:C 3. 有关线性回归的说法不正确的是( )

A. 相关关系的两个变量是非确定关系
B. 散点图能直观地反映数据的相关程度 C. 回归直线最能代表线性相关的两个变量之间的关系 D. 散点图中的点越集中,两个变量的相关性越弱 解析:散点图上的点大致分布在通过散点图中心的那条直线附近,整体上呈 线性分布时,两个变量相关关系越强,故选D.

答案:D

4. 对于线性相关系数r,叙述正确的是(

)

A. |r|∈(-∞,+∞),|r|越大,相关程度越强,反之相关程度越弱 B. r∈(-∞,+∞),r越大,相关程度越强,反之相关程度越弱

C. |r|≤1,且|r|越接近于1,相关程度越强,|r|越接近于0,相关程度越弱
D. 以上说法都不对 解析:根据线性相关系数的意义进行判断. 答案:C 5. 对于独立性检验,下列说法中错误的是( A. K2值越大,说明两事件相关程度越大 B. K2值越小,说明两事件相关程度越小 C. K2≤3.841时,有95%的把握说事件A与B无关 D. K2>6.635时,有99%的把握说事件A与B有关 解析:由独立性检验的思想方法及规则知,K2越大,两事件相关程度越 大,故A、B、D都正确. 答案:C )

6.有10名父亲的体重(x)与10名儿子的体重(y)如下(单位:千克):
父亲体 重(x) 儿子体 重(y)

60

62

64

65

66

67

68

70

72

63.6

65.2

66

65.6

66.9

67.1

67.4

68.3

70.1

如果y与x之间具有线性相关关系,求回归直线方程.

解析: x =

1 (60+62+64+65+66+67+68+70+72+74)=66.8, y =67.02, 10

x 2=4 462.24.

?x2i=44 794, ? xiyi=44 848.9, x ·y ≈4 476.936.
i=1 i=1

10

10

^ ^ ^ 设回归直线方程为y =bx+a,

?xiyi-10 x
^ 则b=
i=1

10

y = 44 848.9-44 769.36 44 794-44 622.4

?x2i-10 x
i=1

10

2

79.54 ≈0.463 5, 171.6 ^ ^ a= y -b x =67.02-0.463 5×66.8≈36.06. = ^ 因此所求的回归直线方程是y =36.06+0.463 5x.

7.在对人们休闲方式的一次调查中共调查了124人,其中女性70人,男性54 人.女性中有43人主要的休闲方式是看电视,另外27人的休闲方式是运动; 男性中有21人的休闲方式是看电视,另外33人的休闲方式是运动. (1)根据以上数据建立一个2×2列联表; (2)休闲方式是否与性别有关? 解析:(1)2×2列联表如下:
休闲方式 性别 女 男 合计 看电视 43 21 64 运动 27 33 60 合计 70 54 124

124×?43×33-27×21?2 (2)由题意得 K2= ≈6.201>5.024, 70×54×64×60 因此,有 97.5%的把握认为休闲方式与性别有关.

8. (2010· 海南、宁夏)对变量 x,y 有观测数据(xi,yi)(i= 1,2,…,10),得散点图(1);对变量 u,v,有观测数据 (ui,vi)(i=1,2,…,10),得散点图(2),由这两个散点 图可以判断( )

A. 变量x与y正相关,u与v正相关 B. 变量x与y正相关,u与v负相关 C. 变量x与y负相关,u与v正相关 D. 变量x与y负相关,u与v负相关 解析:图(1)中的数据随着x的增大而y减小,因此变量x与变量y负相关;图(2) 中的数据随着u的增大,v也增大,因此u与v正相关. 答案:C 9. (2011· 湖南)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下
的列联表:

男 爱好 不爱好 总计
2 2

女 20 30 50

总计 60 50 110

40 20 60

2 n ? ad ? bc ? 110 ? ? 40 ? 30 ? 20 ? 20 ? 2 K ? ? 7.8 ? a ? b ?? c ? d ?? a ? c ?? b ? d ? 算得, K ? 由 . 60 ? 50 ? 60 ? 50

P( K 2 ? k )
k

0.050 3.841

0.010

0.001

6.635 10.828

参照附表,得到的正确结论是 A.再犯错误的概率不超过 0.1%的前提下,认为“爱好该 项运动与性别有关” B.再犯错误的概率不超过 0.1%的前提下,认为“爱好该 项运动与性别无关” C.有 99%以上的把握认为“爱好该项运动与性别有关” D.有 99%以上的把握认为“爱好该项运动与性别无关”

解析:K2≈7.8.由于 K >6.635,所以有 99%以上的把握认为“爱好该项运动与性别有 关” ,故选 C

2

10.(2011 年高考陕西卷理科 9)设 ( x1 , y1 ) , ( x2 , y2 ) , ? ,

( xn , yn )

是变量

x 和 y 的 n 个样本点, 直线 l 是由这些样本点通过最小二乘法得到的线 性回归直线(如图) ,以下结论中正确的是 (A)x 和 y 相关系数为直线 l 的斜率 (B)x 和 y 的相关系数在 0 到 1 之间 (C)当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同 (D)直线 l 过点 ( x, 【答案】D

y)
? ? ? ? bx ? a 又 a ? y ? bx , 所 以 ? y ?

y ? ? 【 解 析 】: 由 ? ? bx ? a 得

? ? bx ? y ? bx ? y 则直线 l 过点 ? y ?

( x, y ) ,故选 D

11. (2011 年高考广东卷理科 13)某数学老师身高 176cm,他 爷爷、父亲和儿子的身高分别是 173cm、170cm、和 182cm.因 儿子的身高与父亲的身高有关, 该老师用线性回归分析的方法 预测他孙子的身高为 【解析】185cm.
由题得父亲和儿子的身高组成了三个坐标(173,170)、 (170,176)、(176,182),其中前面的是父亲的身高, 173+170+176 170 ? 176 ? 182 ? 173 y ? ? 176 3 3 ? (173 ? 173)(170 ? 176) ? (170 ? 173)(176 ? 176) ? (176 ? 173)(182 ? 176) ?b ? ?1 2 2 2 (173 ? 173) ? (170 ? 173) ? (176 ? 173) ?x ? ? a ? y ? b? x ? 176 ? 173 ? 3 ? y ? b x ? a ? 孙子的身高为 y ? 1 ? 182+3=185cm.
? ? ? ? ? ?

cm.


推荐相关:

两变量间的相关关系与统计案例练习题

变量间的相关关系与统计案例练习题_数学_高中教育_教育专区。能力测试点 54:两变量间的相关关系与统计案例 考点一: 1. 某商品销售量 y(件)与销售价格 x(元...


高中数学选修2-3 第三章 统计案例 单元综合测评

高中数学选修2-3 第三章 统计案例 单元综合测评_高二数学_数学_高中教育_教育...独立性检验 解析:回归分析是对具有相关关系的两个变量进行统计分析的一种常用...


选修2-3统计案例单元设计

选修2-3统计案例单元设计_高二数学_数学_高中教育_教育专区。课题名称:统计案例...接着介绍了刻画变量之 间线性相关度的另一种方法——计算线性相关系数,并通过...


数学选修2-3第三章统计案例教案

数学选修2-3第三章统计案例教案_数学_高中教育_教育专区。第三章 统计案例§3.1...(了解) 在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们...


变量间的相关关系与统计案例

变量间的相关关系与统计案例_数学_高中教育_教育专区 暂无评价|0人阅读|0次下载 变量间的相关关系与统计案例_数学_高中教育_教育专区。第二节 变量间的相关关系...


变量间的相关关系与统计案例

变量间的相关关系与统计案例_高三数学_数学_高中教育_教育专区。统计案例 ...1】已知 x,y 的取值如下表所示: x y 0 2.2 1 4.3 3 4.8 4 6.7 ?...


第3讲 变量间的相关关系与统计案例

3变量间的相关关系与统计案例_数学_高中教育_教育专区 暂无评价|0人阅读|0次下载 第3讲 变量间的相关关系与统计案例_数学_高中教育_教育专区。第3讲 ...


变量间的相关关系与统计案例

变量间的相关关系与统计案例_数学_高中教育_教育专区。课时作业(五十五) n?ad-bc?2 附表:K2= ?a+b??c+d??a+c??b+d? P(K2≥k0) k0 0.25 1.323...


高中数学选修2-3第三章 统计案例

高中数学选修2-3第三章 统计案例_高二数学_数学_高中教育_教育专区。3.1 回归分析的基本思想及其初步应用(一)(新授课) 3.1 回归分析的基本思想及其初步应用(二)...

网站首页 | 网站地图
3986 3986.net
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@qq.com