8.3.1 对一个或两个总体间差异的检验
市场调研中最经常需要作的分析之一,就是检验某个总体的均值或比例是否等于、小于或大于某个事先估计的值,或者是两个总体的均值是否相等。对于这些问题我们都可以采用假设检验的方法来完成。
每一个学过统计基础的人都应当熟悉假设检验的方法,所以,在这里我们并不打算重复介绍假设检验的方法,只是想简单地复习一下有关的知识。这样做将帮助我们更熟练地应用这种方法来解决市场调研中的实际问题。
假设检验包括如下的五个基本步骤:第一步是陈述对于总体的推测事实,形成假设。第二步是选择适当的检验统计量。第三步是确定一个判断假设是否正确的标准。第四步是抽取一个随机样本,计算样本的检验统计量并进行检验。第五步是总结假设检验的结果,陈述对于所调研问题的结论。
1.形成假设
假设检验的第一步就是要明确地陈述假设。假设分为原假设H0和备择假设H1.原假设H0和备择假设H1必须是互斥的。原假设(nullhypothesis)与备择假设(alternativehypothesis)之间的关系有几种不同的情形。假如要检验某地居民每年用于购买书籍的花费是否等于500元,则此时的假设就是:
H0:μ=500;H1:μ≠500.
这类想要确认是相等还是不相等的检验称做双侧检验(two-tailedtest)。但是,我们也经常遇到单侧检验的情形。例如下面的几种情形就都属于单侧检验(one-tailedtest)。如果我们的假设是某总体的均值究竟是等于,还是大于某个数,此时的假设就变为:
H0:μ=500;H1:μ>500.
当然,我们也可以假设某总体均值是不大于还是确实大于某个数,此时的假设就变为:
H0:μ≤500;H1:μ>500.
而在某些情形之下,我们的假设是某总体均值是不小于还是确实小于某个数,此时的假设就变为:
H0:μ≥500;H1:<500.
2.选择适当的检验统计量
调研分析人员需要根据所检验假设的特征,来选择适当的用来检验假设的统计量。在检验总体均值或比例的情形,我们会分别采用样本的均值或比例作为检验统计量。根据统计学的结果,样本的均值或比例也服从正态分布,因此,可以根据样本统计量计算出相应的Z值或t值。对于其他类型的假设检验,则需要选择其他更为复杂的检验统计量。
3.确定判断标准
调研人员需要事先确定接受原假设,还是备择假设的依据,这就是显著性水平(significancelevel),通常用α来表示。显著性水平α也就决定了原假设的接受区域与拒绝区域的位置。当所选择的显著性水平α=0.05时,就表示当抽样调查的结果发生的概率小于或等于0.05时,我们才拒绝原假设,接受备择假设;否则,我们就总是接受原假设。根据确定的显著性水平α,我们就可以查表决定分隔原假设的接受区域和拒绝区域的Z和t的值。
4.计算检验统计量并进行检验
从所研究的总体中随机抽取一个样本,计算样本的检验统计量并进行检验。如果样本的检验统计量落在接受区域内,就接受原假设,否则就拒绝原假设。
5.说明检验的结果
总结假设检验的结果,陈述对于最初所调研问题的结论。
由于这类假设检验中我们要利用样本统计量的Z分布或t分布特性,因此,通常把这类检验称做Z检验或t检验。
[例8-6]向阳餐饮公司在A市经营某种特色餐饮获得了成功。公司计划向外地市场扩展。但是,初步的研究表明,这一特色餐饮市场的规模与当地居民每次外出就餐的人均花费有关。向阳公司初步决定,首先向那些居民每次外出就餐的人均花费不低于A市的地方拓展。已知A市居民每次外出就餐的人均花费为86元。向阳公司委托市场调研公司在B市进行抽样调查。结果发现,256个B市居民样本每次外出就餐的人均花费是78元,标准差为48元。向阳公司希望确定,在显著性水平α=0.10的条件下,B市是否具备作为优先开发市场的条件。
根据问题,我们形成假设如下:
H0:μ≥86;H1:μ<86.
该问题所要检验的是总体均值的大小,因此,我们选择样本的均值作为检验统计量。根据题目的意思,这是一个单侧检验问题,在检验的显著性水平α=0.10的条件下,Z=1.28.由此可以计算得到原假设的接受区域为:
α[珚X-Z·σ,α∝)槡n根据题目的已知条件,样本的均值应当大于等于下列值:
86-1.28×48÷16=86-3.84=82.16(元)现在根据抽样调查的结果,B市居民每次外出就餐的人均花费是78元,小于82.16元。显然,样本的检验统计量值落在原假设的拒绝区域内,所以应该决定拒绝原假设,接受备择假设。对于最初所要研究的问题而言,我们所得到的结论是,B市居民每次外出就餐的人均花费明显低于A市,因此,不宜选作为优先拓展的市场。
不过,正如统计学原理所告诫我们的,在进行假设检验时要注意到两类容易犯的错误,通常称为第I类错误和第II类错误。第I类错误是指调研人员根据假设检验的方法拒绝了原来正确的原假设所引起的错误,称做弃真错误。这种错误是由抽样误差所造成的。要减少第I类错误的可能性就需要减少检验的显著性水平α的值。第II类错误是指调研人员没有拒绝本来是错误的原假设所引起的错误,称做取伪错误。要减少第II类错误就需要提高在原假设错误的时候就拒绝它的概率。
通常,我们把发生第II类错误的概率称为β。因此,要减少第II类错误就要减少β的值。
但是,由于第I类错误和第II类错误并不是互补的,而且,一般地α β≠1.
所以要确定合适的α值并不容易。调研人员在确定α的值时,首先必须与调研委托方商讨,由此决定,究竟是第I类错误还是第II类错误所产生的后果将会更严重。如果拒绝了原来正确的原假设会带来严重的后果,就应当取较小的α值,保证尽量不拒绝正确的原假设。
如果接受了原来错误的原假设会带来严重的后果,就应当取较小的β值,保证尽量不接受错误的原假设。但是,β值是从来不能提前设定的。当我们减少α的值时,β值就自然变大了。所以,如果想要减少第II类错误,就应当减少β的值,这可以通过选择一个较大的α的值来实现。
如果第I类错误和第II类错误的影响没有太大的差别,那么,通常会把α的值设定为0.05.
8.3.2 多个总体间参数差异的检验
对于三个或三个以上总体均值之间差异的检验,如果仍然采用Z检验或t检验的方法来解决,就需要进行多次的、每次两两的比较检验。这样就会显得缺乏效率,也会增加出现第I类错误的可能性。解决这类问题的适当方法是使用方差分析(analysisofvariance,ANOVA)。方差分析中的“方差”一词经常会引起人们的误解。事实上,方差分析中的方差的意思并不是去计算一组数据的方差或标准差,其实,方差分析是一种检验不同总体均值之间差异的方法。由于方差分析所要检验的并不是总体是等于还是不等于某个数,而是不同总体间的均值是否相等的问题,所以,方差分析是一种非参数的假设检验。
这一问题所要研究的是三个总体均值之间是否存在明显差异的问题,因此,可以用方差分析的方法来解决。应用方差分析方法时的主要步骤如下:
(1)提出假设
针对上述问题,我们形成的假设是:
H0:μ1=μ2=μ3,即潜在顾客对不同户型的评价无差异;H1:不是所有的μi(i=1,2,3)都相等,即潜在顾客对不同户型的评价有明显差异。
(2)计算样本的组间离差方和(SSA)和平均组间离差方和(MSA)
kSSA=∑n·(Xi-珚X)2i=1对于例8-7而言,我们可以计算得到SSA=50.048.而kMSA=∑n·(Xi-珚X)2/(k-1)i=1例8-7所研究的是三个总体的情形,因此,k=3,MSA=25.024.
(3)计算样本的各组组内离差方和(SSE)和平均组内离差方和(MSE)
knSSE=∑∑(Xij-Xi)2i=1j=1根据例8-7所提供的数据,计算得到SSE=3225.571.而knMSE=∑∑(Xij-Xi)2/(N-k)i=1j=1对于例8-7所提供的观察数据总数,N=42,由此,计算得到MSE=82.707.
(4)计算F统计量
F=MSTRMSE根据统计学的结果,这一统计量服从F分布。对于例8-7而言,可以计算得到F=0.303.
(5)确定接受区域和拒绝区域,实施检验
根据问题中事先给定的检验显著性水平α的值,我们就可以查表,得到F,从而决定接受区域与拒绝区域的分界线。对于例8-7,由于问题事先给定的显著性水平α=0.05,则我们就可以查表得到:
F 0.05(2,39)=3.23现在由于F=0.303<F 0.05(2,39)=3.23,样本的检验统计量F落在接受区域内,因此,我们就接受原假设,说明潜在顾客对于三种不同户型的偏好和满意度没有明显的差异。
不过,实际上我们在应用方差分析法解决问题时,总是应用计算机软件来完成繁杂的计算的。此时,我们只要根据计算机所输出的方差分析表就可以得出方差分析的结论。