3986.net
小网站 大容量 大智慧
相关文档
当前位置:首页 >> 数学 >>

【成才之路】2014-2015学年高中数学 1.7、8相关性 最小二乘估计课件 北师大版必修3


成才之路 ·数学
北师大版 ·必修3

路漫漫其修远兮 吾将上下而求索

第一章
统 计

第一章
§7 相关性

§8 最小二乘估计

1

课前自主预习

3

易错疑难辨析

2

课堂典例讲练

4

课后强化作业

课前自主预习

? 丹顶鹤是生活在沼泽或浅水地带的一种大型 涉禽,常被人冠以“湿地之神”的美称.某 地区的环境条件非常适合丹顶鹤的栖息繁 衍.鹤在中华文化中有着长寿的涵义,我们 经常见到“松鹤延年”的壁画.有个有趣的 现象,如果某村庄附近栖息的丹顶鹤多,那 么这个村庄的老人的长寿率也高;某村庄附 近栖息的丹顶鹤少,那么这个村庄的老人的 长寿率也低.于是得出一个结论:丹顶鹤能 够直接影响该村庄老人的长寿率.你认为这 个结论可靠吗?

? 1.相关性 函数关系 相关关系 和 ? (1)变量之间的两种关系是 __________ __________. ? (2)在考虑两个变量的关系时,为了对变量之 间的关系有一个大致的了解,人们通常将变 散点图 量所对应的点描出来,这些点就组成了变量 之间的一个图,通常称这种图为变量之间的 ________.

? (3)如果变量之间存在着某种关系,这些点会 光滑 有一个集中的大致趋势,这种趋势通常可以 用一条________的曲线来近似,这样近似的 过程称为曲线拟合. 线性相关 ? 若两个变量x和y的散点图中,所有点看上去 非线性相关的 都在一条直线附近波动,则称变量间是 ________的.若所有点看上去都在某条曲线 (不是一条直线)附近波动,则称此相关为 ___________,此时,可以用一条曲线来拟 合.如果所有的点在散点图中没有显示任何 关系,则称变量间是不相关的.

? 2.最小二乘估计 ? (1)如果有n个点:(x1,y1),(x2,y2),?, (xn,yn),可以用下面的表达式来刻画这些点 与直线y=a+bx的接近程度: ? [y1-(a+bx1)]2+[y2-(a+bx2)]2+?+[yn- (a+bxn)]2.

最小值 使得上式达到___________ 的直线 y=a+bx 就是我们所要

最小二乘法 . 如 果 用 x 表 示 求 的 直 线 , 这 种 方 法 称 为 _____________
x1+x2+?+xn y1+y2+?+yn ,用 y 表示 ,则可以求得 b= n n ?x1- x ??y1- y ?+?x2- x ??y2- y ?+?+?xn- x ??yn- y ? ?x1- x ?2+?x2- x ?2+?+?xn- x ?2

x1y1+x2y2+?+xnyn-n x y 2 2 2 2 x + x +?+ x - n x 1 2 n =__________________________________.
y -b x 这样得到的直线方程称为 ______________ 线性回归方程 , a=________.
a,b 是线性回归方程的系数.

? (2)利用最小二乘法估计时,要先作出数据的 散点图.如果散点图呈现一定的规律性,我 最小二乘法 们再根据这个规律进行拟合.如果散点图呈 现出线性关系,我们可以用___________估 计出线性回归方程;如果散点图呈现出其他 的曲线关系,我们就要利用其他的曲线进行 拟合.

? 1.下列两个变量之间的关系是相关关系的是 ( ) ? A.正方体的棱长和体积 ? B.单位圆中角的度数和所对弧长 ? C.单产为常数时,土地面积和总产量 ? D.日照时间与水稻的亩产量 ? [答案] D ? [解析] 函数关系是一个变量与另一个变量之 间有确定性的关系,选项A、B、C均为函数 关系,日照时间与水稻的产量带有一定的随

? 2.对于给定的两个变量的统计数据,下列说 法正确的是( ) ? A.都可以分析两个变量的关系 ? B.都可以用一条直线近似地表示两者的关 系 ? C.都可以作出散点图 ? D.都可以用确定的表达式表示两者之间的 关系 ? [答案] C ? [解析] 两个变量可能是无关的,A、D错误; 两者可能不是线性相关的,此时不能用直线

3.下表是 x 与 y 之间的一组数据,则 y 关于 x 的回归直线 必过点( ) x y A.(2,2) C.(1,2) 0 1 1 3 2 5 3 7

B.(1.5,2) D.(1.5,4)

? [答案] D

[解析]

1+2+3 - x = 4 =1.5,

1+3+5+7 - y= =4, 4 由于回归直线必过点(- x ,- y ),故必过点(1.5,4).

? 4.若施肥量x与小麦产量y之间的回归直线方 程为y=250+4x,当施肥量为50kg时,预计 小麦产量为________kg. ? [答案] 450 ? [解析] 把x=50kg代入y=250+4x可求得y =450kg.

5.由一组观测数据(x1,y1),(x2,y2),?,(x20,y20)得 x =
2 2 1, y =2,x2 1+x 2+?+x 20=29,x1y1+x2y2+?+x20y20=54,

则线性回归方程是________.

? [答案] y=1.56x+0.44
[ 解析 ] x1y1+x2y2+?+x20y20-20 x y 代入公式 b = = 2 2 2 2 x1+x2+?+x20-20 x

54-20×1×2 14 = 9 ≈1.56.a = y - b x = 2 - 1.56×1 = 0.44. 则所 29-20×12 求线性回归方程是 y=1.56x+0.44.

课堂典例讲练

?变量间相关关系的判断
下列关系中, 带有随机性相关关系的是_______. ①正方形的边长与面积之间的关系; ②水稻产量与施肥之间的关系; ③人的身高与年龄之间的关系; ④降雪量与交通事故的发生率之间的关系.

? [思路分析] 两变量之间的关系有两种:函 数关系与带有随机性的相关关系.

? [规范解答] ①正方形的边长与面积之间的关 系是函数关系. ? ②水稻产量与施肥之间不是严格的函数关系, 但是具有相关性,因而是相关关系. ? ③人的身高与年龄之间的关系既不是函数关 系,也不是相关关系,因为人的年龄达到一 定时期身高就不发生明显变化了,因而它们 不具有相关关系. ? ④降雪量与交通事故的发生率之间具有相关 关系. ? [答案] ②④

? [规律总结] 相关关系与函数关系的区别在于 是否具有确定性.在区分二者时,如果一个 变量每取一个值,另一个变量总有唯一确定 的值与之对应,那么这两个变量就是函数关 系,不是相关关系;如果一个变量每取一个 值,另一个变量的取值带有一定的随机性, 并且从总体上来看有关系,但不是确定性关 系,那么这个变量之间就是相关关系,不是 函数关系.确定相关关系时有时要依靠生活 经验大致确定.

? ? ? ? ? ? ? ?

下列两个变量之间不属于相关关系的是( ①学生每日学习时间与学习成绩; ②人的年龄与血压; ③某天的天气情况与股市的涨跌情况; ④球的表面积与体积. A.①② B.①③ C.②③ D.③④ [答案] D

)

4 3 [解析] 在这四组中只有第④组 S 球=4πR ,V 球=3πR ,可
2

以将任一个式子代换 R,得到 V 与 S 之间是一个函数关系,而 第③组天气与股市无关系.

?用散点图判断相关关系
从高一(1)班中随机选出 10 名同学,将他们的身 高、数学成绩和物理成绩列表如下: 身高/m 1.5 1.6 1.55 1.65 1.45 1.06 1.52 1.66 1.7 1.4 78 80 88 83 87 78 76 70 95 90 75 80 68 70 74 68

数学成绩/分 90 85 物理成绩/分 88 84

试判断数学成绩与身高和物理成绩是否成相关关系.

? [思路分析] 分别画出数学成绩与身高、数 学成绩与物理成绩的散点图,即可判断两者是 否为相关关系.

? [规范解答] 我们将上述数据,分别在“数学 成绩—身高”和“数学成绩—物理成绩”的坐 标平面上,画出散点图如下图所示.

? 从图(1)上的散点分布,我们看不出身高与数 学成绩之间有什么相关性,也就是说,这两 个变量之间不存在相关性,而从图(2)上,我 们发现,在数学成绩与物理成绩之间有某种 相关性:不少数学成绩好的同学,物理成绩 也很好,两者之间似乎有一种线性关系,也 就是说,这两个变量近似成线性相关关系. ? [规律总结] 判断变量之间有无相关关系,一 种常用的简便可行的方法就是绘制散点图, 如果点的分布有规律(如大致在一条直线附 近),那么这两个变量之间具有相关关系.

? 某地农业技术指导站的技术员,经过在7块并 排大小相同的试验田上进行施化肥量对水稻 产量影响的试验,得到如下表所示的一组数 据:(单位:千克) 施化肥 15 20 25 30 35 40 45 量x 水稻产 33 34 36 40 44 45 45 0 5 5 5 5 0 5 量y ? 画出散点图,判断施化肥量x和水稻产量y是 否具有相关关系?并考虑水稻的产量会不会 随着化肥施用量的增加而一直增长.

? [解析] 散点图如下:

? 从散点图可以看出施化肥量x和水稻产量y的 确存在一定的相关关系,大体上随着施化肥 量的增加,水稻的产量也在增加. 但增大的速 度在放缓,因此水稻的产量不会随着化肥施 用量的增加而一直增长.

?求回归直线方程
某市近 5 年的煤气消耗量与使用煤气户数如下 表: 年份 x(万户) y(百万立方米) 2008 2009 2010 2011 2012 1 6 1.1 7 1.5 9 1.6 11 1.8 12

(1)检验是否线性相关; (2)求 y 对 x 的回归直线方程.

[思路分析]

根据表中的数据 → 作出散点图 →

判断是否线性相关 → 若是,则根据公式求得a,b → 得回归直线方程

? [规范解答] (1)作出散点图,观察呈线性正 相关,如图所示.

1+1.1+1.5+1.6+1.8 7 - (2) x = =5, 5 6+7+9+11+12 - y= =9, 5
2 2 2 2 2 2 x = 1 + 1.1 + 1.5 + 1.6 + 1.8 =10.26, ?i i =1 5

?xiyi=1×6+1.1×7+1.5×9+1.6×11+1.8×12=66.4.
i =1

5

7 66.4-5×5×9 i=1 170 ^ ∴b= = = 23 , 49 5 10.26-5×25 2 2 - x - 5 x ?i
i=1

x- y ?xiyi-5-

5

170 7 31 - - a= y -b x =9- 23 ×5=-23, 170 31 ∴y 对 x 的回归直线方程为 y= 23 x-23.

[规律总结]

求回归直线方程的步骤:

n 2 (1)先把数据制成表,从表中计算出 xi, yi, xi , xiyi; i=1 i=1 i=1 i=1

?

n

?

n

?

n

?

? n ? x- y ?xiyi-n- ? i=1 ? , ?b= n (2)计算回归系数 a,b,公式为? x2 ? ?xi2-n- i=1 ? ? ? y bx; ?a=- (3)写出回归直线方程 y=bx+a.

已知 x、y 之间具有线性相关关系,且它们之间的一组数据 如下: x y x2 4; (2)求出线性回归方程 y=bx+a. 0 1 1 3 2 5 3 7

2 2 (1)分别计算:- x 、- y 、x1y1+x2y2+x3y3+x4y4、x2 + x + x 1 2 3+

[解析]

可利用表格中的数直接计算,然后把这些结果代

入回归方程系数公式,分别求得 a,b,再求出 y. 0+1+2+3 1+3+5+7 - - (1) x = =1.5, y = =4,x1y1+x2y2 4 4
2 2 2 +x3y3+x4y4=0×1+1×3+2×5+3×7=34,x2 + x + x + x 1 2 3 4=

02+12+22+32=14;

x1y1+x2y2+x3y3+x4y4-4- x- y (2)b= 2 2 2 -2 x2 1+x2+x3+x4-4 x 34-4×1.5×4 = =2 , 14-4×1.52 a=- y -b- x =4-2×1.5=1, 故 y=2x+1.

要分析学生初中升学的数学成绩对高中一年级 数学学习有什么影响,在高中一年级学生中随机抽选 10 名学 生,分析他们入学的数学成绩和高中一年级期末数学考试成绩 (如表):

?利用线性回归方程对总体进行估 计

学生编号

1 2 3 4 5 6 7 8 9

6 6 4 8 8 7 5 9 5 入学数学成绩x 3 7 5 8 1 1 2 9 8 高一期末数学 6 7 5 8 9 8 7 9 5

1 0 7 6 7

? (1)计算入学数学成绩(x)与高一期末数学考试 成绩(y)的线性回归方程; ? (2)若某学生入学数学成绩为80分,试估计他 高一期末数学考试成绩; ? (3)若事实上该学生期末考试数学成绩为94分, 如何解释? ? [思路分析] 先画散点图初步判断相关关系类 型,再结合相应公式进行计算.

? [规范解答] (1)从入学成绩(x)与高一期末数 学考试成绩(y)两组变量的散点图可以看出, 这两组变量具有线性相关关系.

通过计算知: x =70, y =76,
2 ∑ ( x - x )( y - y ) = 1 894 , ∑ ( x - x ) =2 474, 1 i i i =1 i=1 10 10

于是 b=0.765 56,a=- y -b- x =22.410 67, 因此所求的线性回归方程为 y=0.765 56x+22.410 67.

? (2)若某学生入学数学成绩为80分,代入上式 y=0.765 56x+22.410 67,可得y≈84,即这 个学生高一期末数学考试成绩预测值为84 分. ? (3)用样本估计总体时,如果抽样的方法比较 合理,那么样本可以反映总体的信息,但从 样本得到的信息会有偏差.

? 一台机器可以按各种不同的速度运转,其生 产的物件有一些会有缺陷,每小时生产有缺 陷物件的多少随机器转动速度而变化,用x表 示转速(单位:转/秒),用y表示每小时生产的 有缺陷物件的个数,现观测得到(x,y)的4组 观测值为(8,5),(12,8),(14,9),(16,11). ? (1)假定y与x之间有线性相关关系,求y与x之 间的线性回归方程; ? (2)若实际生产中所允许的每小时最多有缺陷 件数为10,则机器的转动速度不得超过多少

[解析] (1)设线性回归方程为 y=bx+a, 8+12+14+16 - 则x= =12.5, 4 5+8+9+11 - y= =8.25, 4 x 2=156.25,- x- y =103.125,

?xiyi=8×5+12×8+14×9+16×11=438,
i =1 4 2 2 2 2 = 8 + 12 + 14 + 16 =660. ?x 2 i i =1

4

x- y ?xiyi-4-
i=1

4

所以 b =

-2 ?x2 i -4 x
i=1

4

438-4×103.125 438-412.5 = = = 660-4×156.25 660-625

51 70, 51 6 - - a= y -b x =8.25-70×12.5=-7. 51 6 所以所求线性回归方程为 y=70x-7. 51 6 760 (2)由 y=70x-7≤10,得 x≤ 51 ≈15. 即机器的转动速度不得超过 15 转/秒.

易错疑难辨析

由一组样本数据(x1,y1),(x2,y2),?,(xn,yn) 得到线性回归方程 y=bx+a,那么下列说法中错误的是( A.直线 y=bx+a 必经过点( x , y ) B.直线 y=bx+a 至少经过点(x1,y2),(x2,y2),?,(xn, yn)中的一个点 C.直线 y=bx+a 的斜率为 b= ∑ i=1xiyi-n x
2 2 ∑ x - n x i =1 i n n

)

y

D.直线 y=bx+a 和各点(x1,y1),(x2,y2),?,(xn,yn)
2 的偏差的平方和∑ [ y - ( bx + a )] 是该坐标平面上所有直线与这 i i i=1 n

些点的偏差的平方和中最小的

? [错解] A

[辨析]

不理解线性回归方程的真正含义.因为 y =b x +

1 1 a,其中 x =n(x1+x2+?+xn), y =n(y1+y2+?+yn),显然回 归直线经过点( x , y ).故 A 是正确的.回归直线最能近似刻画 点(x1,y1),(x2,y2),?,(xn,yn)的变化趋势,但并不一定经 过某些点.故 B 是错误的.对于 C、D 只需了解相应概念便会 得出正确结论.

? [正解] B

[规律总结]

回归直线 y=bx+a,它最能近似反映样本数

据(x1,y1),(x2,y2),?,(xn,yn)所表示点的变化趋势,因为 y =b x +a,所以回归直线过点( x , y ).


推荐相关:

【成才之路】2014-2015学年高中数学(北师大版,必修...0 1 8 0 9 3 5 1 --- (注:方差 s2= [(...2015小升初英语复习备考总复习课件(共91页) 2015...


【成才之路】2014-2015学年高中数学(北师大版,必修...53 3 4 8 9 7 7 8 8 1 4 7 9 9 ) A....(2)画出散点图,并用最小二乘法求出 y 关于 x...


【成才之路】2014-2015学年高中数学(北师大版,必修3)练习:2.1 算法的基本思想]_数学_高中教育_教育专区。【成才之路】2014-2015学年高中数学(北师大版,必修3)...


【成才之路】2014-2015学年高中数学(北师大版,选修...7.879 0.10 2.706 0.001 10.83 不爱好 总计...只有按 ^ ^ ^ ^ 最小二乘法求得回归系数a,b...


2014年高中数学章 统计 相关性最小二乘估计训练 北师大版必修3_数学_高中教育_教育专区。相关性最小二乘估计变量间的相关性是统计的重要内容, 通过...


【成才之路】2014-2015学年高中数学(北师大版,必修3)练习:本册综合测试2]_数学...S=1× = ,第二次循环 k 10 10 =8,S= 9 8 4 7 ×= ,第三次循环,...


2015高中数学 1.7相关性 每课一练(北师大版必修3...(2) x = y= 6分 1 (0.8+1.1+1.3+1.5+...=b (2)请根据上表提供的数据,用最小二乘法求出...


【成才之路】2014-2015学年高中数学(北师大版,选修...3 二、填空题(本大题共 5 小题,每小题 5 分...(1)设“这箱产品被用户接收”为事件 A, 8×7×...


【成才之路】2014-2015学年高中数学(北师大版)选修2-2练习:综合测试11章]_数学_高中教育_教育专区。【成才之路】2014-2015学年高中数学(北师大版)选修2-2...


【成才之路】2014-2015学年高中数学(人教A版)必修三强化练习:2.2.2 用样本的数字特征估计总体的数字特征]_理化生_高中教育_教育专区。【成才之路】2014-2015学...

网站首页 | 网站地图
3986 3986.net
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@qq.com