统计法是对教育问题进行定量分析的重要方法。在教育研究中运用统计法,把从教育观察、教育调查、教育实验等方法中获取的数据,进行定量分析,以说明结果,得出结论,是教育研究方法的主要趋势。本章阐述了统计法的含义与特点;描述统计在教育研究中的应用:统计图表、集中量、差异量、相关系数的意义及计算;推断统计在教育研究中的应用:区间估计、检验的意义及计算。
第一节统计法的含义和特点
一、统计法的含义
统计法,即统计分析方法,是通过分析事物的数量去揭示现象的矛盾及规律的方法。它可以对大量零散的、杂乱无章的信息进行简缩、概括,使其显现清晰的特征和规律,也可从一个个的个体进行观察而得到信息,通过概括、分析、论证,在一定程度上推测到相应的全体。
例如,某小学某年级某班进行了一次数学单元测验,知道了全班45人的成绩,通过绘制统计图表,可以知道分数的分布形态,使无序的数字变为有序。
通过计算这次测验的集中量、差异量,我们可以知道分数的集中趋势和离散程度。通过计算这次成绩与前次成绩的相关系数,我们可以知道两者的相关程度。若某学生此次测验的成绩为80分,运用统计法,可以知道这位学生所处的位置,并对这一成绩的评价提供有关统计数据,等等。
二、统计法的特点
1.描述性
统计法可以通过对资料的整理、分类和简化,描述数据的全貌以及研究对象的某些性质,是统计法的重要特征。描述统计包括数据的初步整理、数据集中趋势和离散趋势以及相关关系的度量等几方面。
2.推断性
统计法具有根据教育实验或调查所获得的已知情况,推测未知情况的功能。可以根据对部分个体(样本)所提供的信息,运用概率的理论进行分析、论证,在一定可靠性程度上推测相应的全体。
3.不确定性
以归纳法为基础的统计推理与数学的演绎推理不同,它具有不确定性。
统计分析是对现实的一种概率估计,因而是有一定误差范围的。运用统计法,在95%的可靠程度上所得出的结论:“某两个总体平均数之间存在着显着性差异”,这同时也意味着,两总体之间不存在显着性差异的可能性还有5%,即该结论是错误的可能性为5%。了解统计法的这一特点,对于正确运用统计法,用多种方法来验证统计结果有十分重要的意义。
4.在一定范围内保证统计结果的正确性
由部分可推知全部,由已知可推知未知,并保证在一定范围内的正确性,这是统计法的魅力所在。虽然由统计推理得出来的结论具有不确定性,但根据一定理论分布的数学模式,运用概率,可以对推理的不确定性进行较为精确的测定,使推测的结论在一定范围内保证它的正确性。如保证人们对未知情况的推理在一百次中有九十五次是正确的。
第二节描述统计在教育研究中的应用
在教育研究中,当研究者在研究过程中,收集到大量的研究数据后,首先应对数据进行初步整理,如制作统计图表等;随后就要对数据的特征进行描述,使其显现出一些趋势,如计算集中量、差异量等。
一、统计图表的绘制
统计图表是以图像、表格的形式统计资料数量关系的重要工具,它可以简化统计资料,直观地反映事物的全貌及蕴涵的特性,省去冗长的文字叙述,便于分析、对比、计算等。
1.统计表的设计
按研究对象的分类项目多少,统计表可设计为单项表和多项表两类。单项表是按一个标志分类的表格。
2.频数分布图表的列法及绘制
一群数据中,每一数值(或一组数值)出现的次数叫频数,通常以字母f表示。
频率是指频数与总次数(n)的比值,通常用Rf表示。公式为:
Rf=fn
频数分布表可以使一堆杂乱的数据趋于清晰,使人一目了然。因此,在教育实践中常常用到它。
制作不连续数据的频数分布表很简单。
例2 某校某班级50名学生的一次外语考试成绩为:
58,56,62,29,91,8l,53,94,93,79,73,77,59,59,48,60,67,58,58,82,48,52,69,56,56,63,58,63,43,57,62,48,50,30,42,60,53,39,62,29,88,44,69,43,53,79,60,48,77,52
全距=最大数-最小数=94-29=65
一般在n≥50时,组数N可取为10≤N≤20;n<50时,可取N=5(或6)。本例中n=50,故组数取10。组距=全距/组数=65/10=6.5≈7
组中值=(上限+下限)/2
累积频数从数值最小的一组开始,每降下一组,必须把以上各组的频数累积起来登记进去。
累积百分比=累积频数/总人数
二、集中量数
集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分布中大量数据向某一点集中的情况。常用的集中量有算术平均数、中位数等。
1.算术平均数
算术平均数是所有观察值的总和除以总频数所得之商,用珚x表示。
平均数常用来估计、比较研究对象的总体水平。比如,要想比较两个班某门学科的测验分数,不能将两个班每一个学生的分数一一列举出来进行比较,因为每个学生的测验分数由于多个因素的影响,大多是不相同的,而且用个别学生的分数进行比较是得不出什么结果的。如果将两个班的平均分数加以比较,就会既经济又明了。
应该指出,在统计方法中用平均数说明问题时既要看到它的优越性,又要考虑到实际情况,而不要单纯看统计数字。当观察对象较多,可靠性要求高的时候,可用平均数说明问题。如果观察对象较少,或者其中含有极端数值,用平均数作代表值就未必合适。
2.中位数
中位数是位于依一定顺序排列的一组数据中央位置的数值。50%的数据分布在它的上方,50%的数据分布在它的下方。用Md表示。
将一组原始数据依大小顺序排列后,如总频数为奇数,就以位于中央的数据作为中位数;如总频数为偶数,则以最中间的两个数据的平均数为中位数。
例3 以下7个数据3,5,7,8,9,11,14的中位数Md=8;而以下8个数据6,9,10,11,12,14,15,17的中位数Md=(11+12)/2=11.5。
中位数对位于两端的数据不像平均数那么敏感。中位数还适用于当分布的两端有未知数据,但数据个数已知时的情况。但中位数的可靠性程度不如平均数。
3.众数
指一组数据中出现次数最多的数。它也在一定程度上反映出这组数据的集中程度。如例1中,做对3题的人最多,3就是众数。而在6个小孩的身高分别为1.52、1.54、1.54、1.52、1.50、1.55,这6个数据中,1.52、1.54就是众数。
三、差异量数
表示一组数据变异程度或离散程度的量叫差异量。
例4 两组学生某科测验分数分别为:
甲组:54,63,70,74,82,90,99
乙组:68,70,73,76,79,82,84
两组分数的平均数均为76,但离散程度却不同。甲组比较分散,参差不齐,即变异较大;乙组比较集中,整齐,即变异较小。可见在描述一组数据的频数分布时,仅仅用集中量是不够的,还必须用该组的差异量加以辅助说明。应用最广的差异量数是标准差σx。
x叫方差。由于标准差σx的单位与其他数据一致。因此,用标准差比用方差更方便。
现用上例甲、乙两组的数据代入公式(9.2)计算标准差得:
σ甲=[(54-76)2+(63-76)2+…+(99-76)2]/7=14.41
σ乙=[(68-76)2+(70-76)2+…+(84-76)2]/7=5.58
σ乙<σ甲,说明乙组测验分数变异程度小,乙组的成绩比甲组整齐。
一般对于同质资料来说,标准差越小,表明数据的变异程度越小,数据越整齐,分布范围越集中;标准差越大,表明数据的变异程度越大,即数据越不整齐,分布范围越广。
四、相关量数
相关量数一般用相关系数表示。其取值范围:-1≤r≤1。当0<r≤1时为正相关,表示一个变量在增加时,另一变量也随着增加;当-1≤r<0时为负相关,表示一变量在增加时,另一变量却反而减少;当r=0时为零相关,表示两个变量的变化互不相关。r的绝对值接近1,为强相关;r的绝对值接近0,为弱相关。
要注意当变量存在相关时,只是说明它们之间有关系,但并不说明它们之间存在着因果关系。相关系数的值,不是用相等单位度量而来的,不能直接作加、减、乘、除运算。如r1=0.6,r2=0.3,在相关程度方面,不能说r1是r2的两倍。但可以说r1的相关程度高于r2。
五、标准分数
标准分数是原始分数与平均数的距离以标准差为单位表示的。
T=50+10Z(9.5)
T分数以50为普通,50以上则越高越优;50以下越低越劣。
如果用比较学生几门学科的总成绩的原始分数相加求和,再比较总分的多少而决定其优劣,这是不够科学的。因为可能由于各科试题难易程度不等,而使某门学科的分数普遍偏高,另一门学科的分数普遍偏低,于是这两门学科分值就不相等,即同为1分,在分数偏高的学科中价值较低,而在分数偏低的学科中价值较高。由于各科的原始分数没有恒定不变的相等单位,所以无法将之相加求和,也无法进行比较。如果将各科原始分数转换成标准分数,那么无论各科的平均数和标准差多么不同,都转化为平均数为0、标准差为1的标准形式,具有绝对等价的单位,可以相加求和,因此,比较各科标准分数的总和较为科学。
第三节推断统计在教育研究中的应用
教育研究一般不可能对所要研究的对象的全体逐一进行观测,而是从总体中抽取一定的样本进行研究,这样就需要由样本估计和推测总体,统计法中的推断统计就具有这样的功能。
一、区间估计
以样本平均的概率分布为理论依据,按一定概率要求,由样本统计量的值估计总体平均数的所在范围,称为总体平均数的区间估计。
二、假设检验
假设检验是利用样本的信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断的方法,是推断统计中运用最普遍,也是最为重要的统计方法。
假设检验一般有两个相互对立的假设。即零假设和备择假设。所谓零假设就是关于当前样本所属的总体与假设总体无区别的假设,用H0表示。所谓备择假设是与零假设相互排斥的假设,是关于当前样本所属的总体与总体假设相反的假设。
假设检验是从零假设出发,视其被拒绝的机会,如果根据样本的信息,不得不否定零假设的真实性,这时,就要拒绝零假设而接受被择假设;如果根据样本的信息,不能否定零假设的真实性时,就要保留零假设而拒绝被择假设。
统计学中把这种拒绝零假设的概率称为显着性水平,用α=0.05,α=0.01表示。