他们在研究中使用了合理(甚至可以说偏低)的效度系数。Cascio和Ramos采用的效度系数为0.388。这恰好与第七章以及本章前面讨论过的平均效度水平基本一致。Burke和Frederick采用了0.59的效度系数,这仍然没有超出Thornton、Byham(1982)以及Gaugler(1987)提出的效度范围。换句话说,0.59的效度系数的确比较高,但是并非无法达到。他人的研究已经证明了这一点,而且我们已经讨论过怎样才能达到较高的效度系数。
我们说这里的效度系数偏低的另一个理由是,随着时间的推移,评鉴中心的预测效度会不断提高。出于实际操作上的考虑,人们只能收集评鉴中心结束后几个月或少数几年的数据进行研究。要把时间跨度拉得足够长几乎是不可能办到的。所以,大部分关于预测效度的研究只能在较短的时间跨度上进行。为数不多的几家企业在评鉴中心结束很久以后研究了它的预测效度,结论是预测效度会随着时间的增加不断提高。表9.2就是一个很好的例子。AT&T评鉴中心的预测效度在8年和16年后有了相当的提高;IBM也发现随着时间的推移,评鉴中心测评结果显得越发准确;1988年,Wolfson在研究中发现1984年(或略早)实施的评鉴中心预测效度为0.29,1982年(或略早)实施的为0.31,1980年(或略早)的则为0.37。
其他测评工具的效度
Cascio、Ramos的研究和Burke、Frederick的研究都拿评鉴中心与背景面试作了比较。背景面试是企业界广泛采用的传统人才选拔工具。他们假设面试的效度系数是0.13和0.16,这是统计当时的相关文献后得出的平均值。如果面试的过程更加结构化、系统化和标准化,它的效度系数有可能会提高。从这个意义上说,这里的效度可能被低估了。Weisner、Cronshaw(1988)和Harris(1989)的研究指出,面试也可以达到评鉴中心的效度水平。
但是,大量的企业发现他们的面试没什么效果,很难通过面试找到优秀的管理人员,于是他们纷纷建立起评鉴中心。当然,如果表9.5的面试的效度提高了,评鉴中心的效用数据就会降下来。
下一轮比较的对象是评鉴中心和能力倾向测验(aptitudetest)。目前的研究结果产生了冲突。Schmitt等人1984年的研究认为评鉴中心的预测效度要高于能力倾向测验,但另一份研究报告(Hunter&Hunter,1984)恰好持相反的观点。综合所有的相关文献来看,能力倾向测验的效度基本与评鉴中心持平。正是由于这一点,再加上能力倾向测验的成本相对较低,它似乎更受欢迎。但是,能力倾向测验效度的差异很小(Murphy,1988)(这就意味着,无论能力倾向测验的设计水平有多高,它的效度也不会有多大变化——译者),而评鉴中心如果设计得好,并且严格加以执行,它的准确性可能会非常高。
为什么愿意用评鉴中心?这里还有几种解释。一是在甄选和晋升项目中,纸笔测验通常不大讨候选人喜欢,而评鉴中心则不存在这一问题。在纸笔测验中,候选人往往会觉得自己没有机会施展与工作相关的才能。从本质上说,纸笔测验缺乏情境模拟的“表面效度(facevalidity)”。另外,某些候选人会觉得自己无法控制纸笔测验的结果。如果是评鉴中心,他们则可以为情境演练提前作准备,从而让自己在测评师面前表现得更好。
二是就算人们相信能力倾向测验和评鉴中心效度相当,成本更低,他们往往还是宁愿选择后者。这是由于很多人认为能力倾向测验对少数民族和女性不公平。其实,事实并非如此。对能力倾向测验的研究表明,它的效度或预测准确性并不会因民族和性别而产生差异。但是,无论如何,“不公平”这一想法的杀伤力太大了。企业通常不愿卷入这种争端。正好,大家都认为评鉴中心是公平的(尤其是根据1976年Huck和Bray以及1982年Thornton和Byham的研究,评鉴中心对少数民族和妇女都很公平),于是它受到了企业的青睐。
三是评鉴中心有助于了解测评对象的个人优势和不足,这对于企业的人员安置和监管都很有诱惑力,因此,纸笔测验不敌评鉴中心。评鉴中心提供了丰富的行为证据,据此可以推断测评对象在实际工作中的表现;相反地,能力倾向测验只能给出一两个分数,无法提供这些信息。
成本
对评鉴中心的各种成本进行测算,用最低标准来看,可以仅仅包括测评材料和工作餐。进一步说,则包括评鉴中心的开发成本和执行费用。测评师和测评对象所花费的时间通常不作为成本进行考虑,因为测评过程也可以算成对所有测评对象的培训发展。工资费用被培训收益抵消,也就不需要纳入效用计算公式了。该公式只考虑更好的人才选拔工具所引起的成本。虽然对实际发生的成本还存在种种争议,但Cascio和Sibly(1979)指出,评鉴中心的效用对成本数据不敏感,即是说,成本数据的变化对最终的效用影响不是很大。这一点看上去不大直观,但是,一旦少量的测评成本(比如几百美元)带来极其可观的收益(来自杰出管理人员的合理决策,比如,节约成千上万美元的成本),评鉴中心的效用就会显得非常明显。
工作业绩的差异(SDy)
用货币形式表示工作业绩的标准差(SDy),效用分析对SDy就显得非常敏感。SDy考察的是目标岗位上有效管理者和平庸管理者之间的工作业绩差距。举个例子,这部分推理就容易理解了。假设每个售货员卖出相同数量的商品,他们的SDy就很小。相反地,如果某些售货员卖出了价值成千上万的商品,而另一些只卖了几百美元,他们的SDy就比较大。在这种情况下,更加准确的人才选拔新方法就会很有效用。
我们几乎没有办法客观地测量SDy所带来的经济后果。值得庆幸的是,对SDy的研究殊途同归,不同的研究方法得出了类似的结论(Burke&Frederick,1986;Reilly&Smither,1985;Weekly,O’Conner,Frank,&Peters,1985),所以我们才能相信效用分析的结果。Burke和Frederick的研究尤其值得一提,因为他们研究了大量的SDy数据,并分析了这一指标对总效用的影响。即使我们故意低估SDy,也可以说评鉴中心值得投资。企业每年可以从用它选出的每一位管理人员身上获取2500美元到21000美元的好处。
关于效用的其他研究得出了相似的结论。Hogan和Zenke(1986)指出,使用评鉴中心选拔中学校长的收益(用货币形式计量)高达58000美元;Huck(1987)则表示,用评鉴中心从132位候选人中挑选29名管理人员能够带来554000美元的效用,投资回报率是210%;Feltham(1988a)发现英国的评鉴中心平均收益为550000英镑,折合1000000美金。1989年,Goldsmith比较了3套测评方案:(1)含有个人信息的纸笔测验(效度0.30);(2)评鉴中心(效度0.43);(3)由2轮面试、背景信息核查组成的评鉴中心(效度0.55)。这3套方案被用来为某上市公司的核心部门选拔一线管理人员。方案2比方案1多产生了1744445美金的收益,方案3比方案1多带来9205639美金的收益。工作类型和标准的不同导致了较大的效用差异。但是,结论非常清楚:评鉴中心是一项很不错的投资。
评鉴中心的其他好处
前文的效用分析结果表明,用评鉴中心选拔管理人员所增加的成本与所带来收益相比,可以说微不足道。实际上,评鉴中心所带来的好处很多,绝不仅仅是更好地选拔管理人员所能概括的。参加评鉴中心的人比参加纸笔测验或面试的人收获更大。在评鉴中心里,测评对象不仅可以了解自己的行为风格,还有机会观察其他人怎样做事。即使是在不含培训的纯粹的选拔或晋升项目里,这种提高也在随时随地地发生。测评信息反馈环节也会让测评对象受益匪浅。就算是选拔或培训项目的简单反馈,测评对象也可以知道测评师怎样评价自己的决策水平和工作风格,即使我们没有专门为测评对象制定培训计划,他们也可以运用测评结果自发做出提高和发展。
测评师本人也可以从评鉴中心获益。培训师都要接受专门的培训,在测评过程中培训师需要相互交流,这就让他们有机会学到大量的管理技能,比如怎样观察行为,怎样评价下属以及怎样做决策等等。测评师自己也承认参加这种活动对他们本人是有好处的(Thornton&Byham,1982)。
Lorenzo在1984年作了一项研究:一组企业管理人员没能接触测评活动(控制组),另一组管理人员经过专门的培训,然后担任了为期3个月的测评师(实验组)。结果,实验组的人在口头沟通和通过面对面的谈话进行信息收集、评价等方面明显优于控制组。
有研究表明,一个管理人员先以测评师的身份参加了低层管理人员测评,然后以测评对象的身份出现在高层管理人员测评项目中,奇怪的是,他的表现并不会有多大提高(Struth,Frank&Amato,1980)。为什么他在高管测评中没有表现出优势?对此,Struth等人提出了几种可能的解释:
一是高管测评项目中通常要测量各种不同的技能;二是在高管项目中,测评对象的水平通常都比较高;三是他在担任低层管理人员测评的测评师所学到的东西并不适用于高管测评。
评鉴中心给企业带来的好处远不止这些。1977年,Alon指出,评鉴中心为他的公司带来了许多正面影响。把各级管理人员召集到一起讨论测评指标的定义并实施测评,这些活动使得不同层面的管理人员对目标岗位(超级市场店长)在认识上达成一致。同时,管理人员通过相互学习,管理水平都有所提高。这一切都对公司的下一步发展起了推动作用。
本章小结
评鉴中心显示出很高的预测效度。毋庸置疑,一个评鉴中心如果设计的好,可以帮助企业成功地找到有才能的管理人员。而且,根据测评结果得出的管理能力的优势和不足,有助于帮助我们诊断培训需求,制定培训计划,建立起高效的管理团队。
评鉴中心这种方法非常复杂。随着研究的不断深入,我们对评鉴中心的优势和不足的认识在不断变化。很多人都在研究,评鉴中心到底测了些什么东西,但还是没有定论。这样一来,关于“评鉴中心为什么有用”的传统解释,就成为一种主流观点。测评师观察并界定行为,然后对各个指标进行打分。虽然个别人在反对传统观点的同时提出了新的解释,但这还不足以推翻传统的解释。测评指标是整个评鉴中心的基础,它表现了一些人格特质。设计一个评鉴中心需要做以下工作:描述工作要求,设计演练情境,培训测评师,制定行为观察准则,确立评分标准以及对测评对象和他们的上级进行反馈。
评鉴中心成本很高,但这份投入是值得的。设计、执行和维护评鉴中心的成本可能很高,尤其当我们把测评对象和测评师的时间成本考虑进来时更是如此。关于评鉴中心的经济效用分析表明,投在评鉴中心上的任何一分钱都是值得的。而且,评鉴中心能够带来的许多好处是其他测评工具(纸笔测验、面试等)所不具备的:经历了评鉴中心以后,测评师和测评对象的管理才能都会有所提高,而与其他的人力资源管理评价工具相比,这种方法的公正性已经得到广泛的认可。