概率论大作业

一、题概述和分析

(1)实验内容说明:

(验证性实验)某地某年高考后随机抽得15名男生、12名女生的物理考试成绩如下:

男生: 49 48 47 53 51 43 39 57 56 46 42 44 55 44 40
女生: 46 40 47 51 43 36 43 38 48 54 48 34

从这27名学生的成绩能说明这个地区男女生的物理考试成绩不相上下吗?(显著性水平$\alpha=0.05$).

(2)本门课程与实验的相关内容

正态分布,t分布,F分布,MATLAB,直方图,显著性水平,置信区间,拒绝域

(3)实验目的

加深对正态、t、F分布的理解,会使用MATLAB进行操作,能进行两个正态总体均值的假设检验

二、实验设计总体思路

2.1、引论

想从学生们的成绩比较这个地区男女生的物理考试水平

2.2、实验主题部分

2.2.1、实验设计思路

1、理论分析

题目给出两组学生的成绩(样本数不相同),但是未说明样本服从什么分布,所以应先验证样本服从正态分布。接着验证两总体方差是否相等,$H_0':\sigma^2_1=\sigma^2_2$,$H1’:σ^1_2\neqσ^2_2$。再进行两个正态总体均值的假设检验$H_0:\mu1=\mu2$,$H_1:\mu1\neq\mu2$。

2、实现方法

(1)验证样本服从正态分布

令$X=[49,48,47,53,51,43,39,57,56,46,42,44,55,44,40]$,假设样本X服从正态分布,在MATLAB中观察X的频数直方图,观察X的正态曲线拟合,用MATLAB对X进行参数估计,参数包括样本均值、均值置信区间,样本方差、方差置信区间。

得样本均值为47.6,均值置信区间为[44.3927, 50.8073],样本方差为5.7916,方差置信区间为[4.2402,9.1340],即有理由相信样本X服从正态分布

同理设$Y=[46,40,47,51,43,36,43,38,48,54,48,34]$,假设其服从正态分布,在MATLAB中Y的观察频数直方图,观察Y的正态曲线拟合,用MATLAB对Y进行参数估计,参数包括样本均值、均值置信区间,样本方差、方差置信区间。

得样本均值为44,均值置信区间为[40.1115, 47.8885],样本方差为6.12,方差置信区间为[4.3354,10.3910],即有理由相信样本Y服从正态分布。

(2)检验两样本总体方差是否相等

$H_0':\sigma^2_1=\sigma^2_2$

检验统计量$F=\frac{S^2_1}{S^2_2}=\frac{5.7916}{6.12}=0.9463$

拒绝域为$[-∞,F_{1-\frac{α}{2}}(n_1-1,n_2-1)]或[F_{\frac{α}{2}}(n_1-1,n_2-1),∞]$

经查表的拒绝域为$[-∞,0.3231][3.3588,∞]$

F没有落在拒绝域中,故接受$H_0$,认为两样本总体方差相等。

(3)检验两样本总体均值是否相等

$H_0:\mu1=\mu2$,$H_1:\mu1\neq\mu2$

检验统计量为 $$ t=\frac{\bar{X}-\bar{Y}}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} $$

$$ S^2_w=\frac{(n_1-1)S^2_1+(n_2-1)S^2_2}{n_1+n_2-2} $$

计算得到 $$ t=\frac{3.6}{5.936\times(\frac{1}{15}+\frac{1}{12})^{0.5}}=1.5659 $$ 拒绝域为$[-∞,-t_{α/2}(n_1+n_2-2)]或[t_{α/2}(n_1+n_2-2), ∞]$,经查表得为$[-∞,-2.0595]或[2.0595, ∞]$

t没有落在拒绝域中,故接受$H_0$,认为这个地区男女生的物理考试成绩不相上下

2.2.2、实验结果及分析

X的频数直方图和正态曲线拟合:

img

img

Y的频数直方图和正态曲线拟合:

img

img

样本X和Y均服从正态分布,为下面进行检验(t和F分布)做铺垫。

两样本总体方差相等,为检验两样本总体均值是否相等提供$\sigma^2_1==\sigma^2_2$,但是都未知的条件,这个地区男女生的物理考试成绩不相上下,得出结论。

2.2.3、程序及其说明

1
2
3
4
5
6
7
8
X=[49,48,47,53,51,43,39,57,56,46,42,44,55,44,40];	%将男生成绩的样本定义为X
hist(X,18);                       					%绘制频数直方图
histfit(X,18);                     					%观察正态曲线拟合情况
[muhat,sigmahat,muci,sigmaci]=normfit(X,0.05);      %将女生成绩的样本定义为X
Y=[46,40,47,51,43,36,43,38,48,54,48,34];          	%参数估计
hist(Y,20);                       					%绘制频数直方图
histfit(Y,20);                      				%观察正态曲线拟合情况
[muhat,sigmahat,muci,sigmaci]=normfit(Y,0.05);      %参数估计
1
F=5.7916/6.12=0.9463                  				%计算
1
T=3.6/(5.936*(1/15+1/12)^0.5)=1.5659        		%计算

2.3、对教材正文的深入理解和创新性说明

2.3.1、 对教材正文的深入理解

统计推断的另一类重要问题是假设检验问题,在总体的分布函数完全未知或只知其形式、但不知其参数的情况,为了推断总体的某些未知特性,提出某些关于总体的假设,再根据样本对所提出的假设作出是接受还是拒绝的决策,假设检验是做出这一决策的过程。

2.3.2、对论文中探索性内容或创新点说明

改实验为验证性实验,非探究性实验

2.4、体会

在刚开始拿到题目时并没有学到假设检验,但是自己看书后能大概清楚假设验证的原理和实施过程,学习了课本第八章后理解了应如何进行假设检验。在实验过程中接触了MATLAB的一些关于概率的使用函数、方法和作图技巧,实际操作中还是遇到了许多问题,但在看书查资料后一一解决。题目中关于F分布表,查询课本的附录发现课本上的表并不完整,于是在网上下载了更为完整的表进行查询,得到了更为精确的结果。

updatedupdated2020-07-162020-07-16