变量间的相关关系与统计
案例教师版
Newly compiled on November 23, 2020
变量间的相关关系与统计案例
【知识要点】
1.相关关系的判断
(1)如果散点图中点的分布从整体上看大致在一条直线的附近,我们说变量x和y具有线性相关关系.
(2)样本数据(xi,yi)(i=1,2,…,n)的相关系数r??(x?x)(yii?1n2nii?1ni?y)i 当r?0时,
?(x?x)?(yi?1?y)2两变量正相关,当r?0时,两变量负相关,当|r|?1且|r|越接近于1,相关程度越高,当|r|?1且|r|越接近于0,相关程度越低. 2.回归方程的求法
求回归方程的方法是最小二乘法,即使得样本数据的点到回归直线的距离的平方和最小.
若变量x与y具有线性相关关系,有n个样本数据(xi,yi)(i=1,2,…,n),则回归方程
??y?bx?a中斜率和截距的最小二乘估计公式分别为:
___1n1n其中x??xi,y??yi,(x,y)称为样本点的中心.
ni?1ni?1___??【重点】 回归直线y?bx?a必过样本点的中心(x,y),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.
3.独立性检验
设X,Y为两个变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:
x1 x2 总计 y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d 0.05 0 3.84 1 0.010 0.001 6.6310.825 8 利用随机变量K2?n(ad?bc)2(其中n?a?b?c?d为样本容量)来
(a?b)(c?d)(a?c)(b?d)判断“两个变量有关系”的方法称为独立性检验. 【例题解析】
题型一 变量间的相关关系
【例1】对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )
A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3 C.r4<r2<0<r3<r1 r3
D.r2<r4<0<r1<
解析:选A 易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r2<r4<0<r3<r1.
【变式1】四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且y=-; ②y与x负相关且y=-+; ③y与x正相关且y=+; ④y与x正相关且y=--.
其中一定不正确的结论的序号是( )
A.①② B.②③ C.③④ D.①④
解析:选D 正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④,故选D.
相关关系的直观判断方法就是作出散点图,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性,若呈图形区域且分布较乱则不具备相关性.
【例2】(2014·湖北高考)根据如下样本数据
x y 3 4 5 - 6 7 - 8 - ^^^^
^得到的回归方程为y=bx+a,则( )
A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0 解析:选B 由表中数据画出散点图,如图, 由散点图可知b<0,a>0,选B.
^
【例3】对于下列表格所示五个散点,已知求得的线性回归方程为y=-155,则实数m的值为( )
x y 196 1 197 3 200 6 203 7 204 m B. C. D. 196+197+200+203+2041+3+6+7+m17+m
解析:选A x==200,y==.
55517+m?17+m?^
样本中心点为?200,,将样本中心点?200,代入y=-155,可得m=8.
5?5???
变量间的相关关系与统计案例教师版



