教学单元案例: 参数估计与假设检验
北京化工大学 李志强
教学内容:统计量、抽样分布及其基本性质、点估计、区间估计、假设检验、方差分析 教学目的:统计概念及统计推断方法的引入和应用
(1)理解总体、样本和统计量等基本概念;了解常用的抽样分布;
(2)熟练掌握矩估计和极大似然估计等方法; (3)掌握求区间估计的基本方法; (4)掌握进行假设检验的基本方法; (5) 掌握进行方差分析的基本方法;
(6)了解求区间估计、假设检验和方差分析的MATLAB命令
。
教学难点:区间估计、假设检验、方差分析的性质和求法 教学时间:150分钟
教学对象:大一各专业皆可用
一、统计问题 引例
例1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为:
775,816,834,836,858,863,873,877,885,901
问:新产品亩产是否超过了800斤?
例2 设有一组来自正态总体N(?,?)的样本0.497, 0.506, 0.518, 0.524, 0.488, 0.510, 0.510, 0.512. (i) (ii) (iii)
已知?=0.012,求μ的95%置信区间; 未知?,求μ的95%置信区间; 求?的95%置信区间。
2222例3现有某型号的电池三批, 分别为甲乙丙3个厂生产的, 为评比其质量, 各随机抽取5
.N(?i,?2). 只电池进行寿命测试, 数据如下表示, 这里假设第i种电池的寿命Xi~工厂 甲 乙 丙 寿命/h 40 26 39 48 34 40 38 30 43 42 28 50 45 32 50 (1) 试在检验水平??0.05下,检验电池的平均寿命有无显著差异? (2) 利用区间估计或假设检验比较哪个寿命最短.
二 统计的基本概念: 总体、个体和样本
(1)总体与样本
总体 在数理统计中,我们将研究对象的某项数量指标的值的全体称为总体,总体中的每个元素称为个体
比如,对电子元件我们主要关心的是其使用寿命.而该厂生产的所有电子元件的使用寿命取值的全体,就构成了研究对象的全体,即总体,显然它是一个随机变量,常用X表示 为方便起见,今后我们把总体与随机变量X等同起来看,即总体就是某随机变量X可能取值的全体.它客观上存在一个分布,但我们对其分布一无所知,或部分未知,正因为如此,才有必要对总体进行研究.
简单随机样本
对总体进行研究,首先需要获取总体的有关信息. 一般采用两种方法:
一是全面调查.如人口普查,该方法常要消耗大量的人力、物力、财力.有时甚至是不可能的,如测试某厂生产的所有电子元件的使用寿命. 二是抽样调查. 抽样调查是按照一定的方法,从总体X中抽取n个个体.这是我们对总体掌握的信息.数理统计就是要利用这一信息,对总体进行分析、估计、推断.因此,要求抽取的这n个个体应具有很好的代表性.
按机会均等的原则随机地从客观存在的总体中抽取一些个体进行观察或测试的过程称为随机抽样.从总体中抽出的部分个体,叫做总体的一个样本.
从总体中抽取样本时,不仅要求每一个个体被抽到的机会均等,同时还要求每次的抽取是独立的,即每次抽样的结果不影响其他各次的抽样结果,同时也不受其他各次抽样结果的影响.这种抽样方法称为简单随机抽样.由简单随机抽样得到的样本叫做简单随机样本.往后如不作特别说明,提到“样本”总是指简单随机样本.
从总体X中抽取一个个体,就是对随机变量X进行一次试验.抽取n个个体就是对随机变量X进行n次试验,分别记为X1,X2,…,Xn.则样本就是n维随机变量(X1,X2,…,Xn).在一次抽样以后, (X1,X2,…,Xn)就有了一组确定的值(x1,x2,…,xn),称为样本观测值.样本观测值(x1,x2,…,xn)可以看着一个随机试验的一个结果,它的一切可能结果的全体构成一个样本空间,称为子样空间.
(2)样本函数与统计量
设x1,x2,?,xn为总体的一个样本,称
??? (x1,x2,?,xn)
为样本函数,其中?为一个连续函数。如果?中不包含任何未知参数,则称?(x1,x2,?,xn)为一个统计量。
2、统计量
(1)常用统计量
样本均值
1nx??xi.
ni?1n12S2?(x?x). ?in?1i?1样本方差
(与概率论中的方差定义不同)
样本标准差
1nS?(xi?x)2. ?n?1i?11nkMk??xi,k?1,2,?.
ni?11n???(xi?x)k,k?2,3,?. Mkni?12样本k阶原点矩
样本k阶中心矩
1n2(二阶中心矩S*??(Xi?X)与概率论中的方差定义相同)
ni?1
例6.2:用测温仪对一物体的温度测量5次,其结果为(℃):1250,1265,1245,1260,
21275,求统计计量X,S和S的观察值x,,s和s.
2
(2)统计量的期望和方差
E(X)??,D(X)??2n,
E(S2)??2,E(S*2)?2n?12?, n1n2其中S*??(Xi?X),为二阶中心矩。
ni?1X1,X2,?,Xn~F(x),i.i.d,独立同分布。无限总体抽样。
(3) 随机数生成
在Matlab中各种随机数可以认为是独立同分布的,即简单随机样本。以下罗列在Matlab中的实现方法。
X1,X2,?,Xn~U(0,1),均匀分布样本
n=10;x=rand(1,n)
X1,X2,?,Xn~U(a,b)
n=10;a=-1;b=3;x=rand(1,n);x=(b-a)*x+a
X1,X2,?,Xn~N(0,1),正态分布样本
n=10;x=randn(1,n)
X1,X2,?,Xn~N(a,b2)
mu=80.2;sigma=7.6;m=1;n=10; x=normrnd(mu,sigma,m,n)
上面首先对总体均值赋值mu=80.2;再对标准差赋值sigma=7.6; m=1;n=10;分别对生成的随机阵对的行数和列数进行赋值,然后可直接利用Matlab自带的函数normrnd生成正态分布的随机数。
类似地可生成m行n列的随机矩阵,服从指定的分布。生成随机数的函数后缀都是rnd,前缀为分布的名称。常用分布的随机数产生方法罗列如下,注意使用前先要对参数赋值。
x=betarnd(a,b,m,n) 参数为a,b的beta分布; x=binornd(N,p,m,n) 参数为N,p的二项分布; x=chi2rnd(N,m,n) 自由度为N的?分布; x=exprnd(mu,m,n) 总体期望为mu的指数分布; x=frnd(n1,n2,m,n) 自由度为n1与n2的F分布; x=gamrnd(a,b,m,n) 参数为a,b的?分布;
x=lognrnd(mu,sigma,m,n) 参数为mu与sigma的对数正态分布; x=poissrnd(mu,m,n) 总体均值为mu的Poisson分布; x=trnd(N,m,n) 自由度为N的T分布; Matlab统计工具箱中还有一些其它分布,不再一一列举。
23、三个抽样分布(χ、t、F分布)
1.3 三个常用分布
以下罗列出数理统计中三个重要分布的概念与性质。
2
1.3.1 ?2分布
定义1.2 设一维连续型随机变量X的密度函数为
nx?1??1x2e2,?n/2fn(x)??2?(n/2)?0,?x?0x?0 (1-2)
2则称X服从自由度为n的?分布,记为X~?(n)。
20.140.120.10.080.060.040.0200510152025303540
图1-2 ?分布密度函数示意图
(1)期望与方差:EX?n,DX?2n
(2)来源:若X1,X2,?,Xn~N(0,1)独立同分布,则
22X12?X2???Xn~?2(n)
2(3)可加性:若Y1~?(n1),Y2~?(n2),且两者独立,则有
22Y1?Y2~?2(n1?n2)
2(4)重要结论:若X1,X2,?,Xn~N(?,?),则
(n?1)S2?2??(Xi?12ni?X)2~?2(n?1)
?2以下给出了自由度为5,10,20的?分布的密度函数,如图1-2所示。
1.3.2 t分布
定义1.3 设一维连续型随机变量X的密度函数为
数理统计--参数估计、假设检验、方差分析(李志强) (3)



