好文档 - 专业文书写作范文服务资料分享网站

多元线性回归模型中处理多重共线性方法对比

天下 分享 时间: 加入收藏 我要投稿 点赞

龙源期刊网 http://www.qikan.com.cn

多元线性回归模型中处理多重共线性方法对比

作者:范圣岗 奚书静

来源:《科技风》2020年第23期

龙源期刊网 http://www.qikan.com.cn

龙源期刊网 http://www.qikan.com.cn

摘 要: 存在多个指标的多元线性回归模型容易发生多重共线性问题,利用手动剔除法、逐步回归法、主成分回归法解决此问题,并构造人口迁移对教育资源冲击测定模型对比三者差异。输出结果显示手动剔除法与逐步回归法剔除无效指标后对模型的预测更具真实性,而主成分回归法虽保留了各项指标,但其结果可能是偏离现实的。 关键词: 多重共线性;手动剔除法;逐步回归法;主成分回归法 1 教育资源指标的选定与多元线性回归方程 1.1 教育资源冲击问题简介与指标选取

人口大量向城镇进行迁移必然会给当地的教育资源带来巨大冲击,当发生教育资源失衡时,可能导致教师负担加重和教学场地供应不足,最终地区的教育持续恶性发展。表1给出我国某县教育资源的相关数据,指标“师生比”开始从左至右依次设为x1,x2,…,x6,Y。 1.2 多元线性回归模型与共线性问题

多元回归模型Y; ^ -β0+β1x1+β2x2+…+βnxn+ε利用最小二乘法(minQ=min∑ m j=1 [Yj-(β0+∑ n i=1 βixij)]2)得的参数是真实值的无偏估计。对数据输出得到方程: Y; ^ =-0.015+0.545x1+0.008x2+0.034x3-0.002x4-0.005x5+0.104x6

输出结果显示人均教学面积与人均图书册数对Y成反比,即学生的人均拥有图书越多则学生成绩越差,这与基本逻辑不符。利用模型输出方差膨胀系数VIFi= 1 1-R2i 判断出多个指标存在多重共线性问题(VIF≥10),出现此原因可能是选取的指标存在着高度相关关系。 2 共线性问题的改进与比对 2.1 手动剔除变量

对两个VIF值偏大的指标x5,x6进行剔除,得到多元回归方程:

46qyh33pd12xn8u9whcj4n25q6ny0j004h8
领取福利

微信扫码领取福利

微信扫码分享