登陆注册
4855900000021

第21章 观察和界定行为(4)

Borman(1978)认为评分形式或格式是造成评分不能变得更稳定或更准确的四个潜在原因之一(其他三个原因是缺乏观察行为的机会,缺乏对评分错误的理解和组织上的限制)。理想情况下,评分表应该能和测评师的心理过程相容,而不需要他们做他们无法做出的判断。几位研究者(Baker,1986;Campbell,1986;Louiselle,1986)提出,传统的描述性报告之外的测评形式能够通过简化对测评师信息加工方面的要求来提高评鉴中心的准确性。Louiselle(1986)还比较了传统的描述性行为报告表和预先制定的行为列表对每一个练习后指标评分间相关程度的影响。对于通过叙述性报告得到的评分结果,因素分析的结果表明,对测评师评分的最佳解释同时包含了指标和练习信息。然而,对于行为列表评分来说,还没有合适的解答这些信息的方法。

这样,叙述性报告的格式被证明在指标评分上具有聚类效度和区分效度。然而,行为列表却没有相应的证据。这种情况下,行为列表缺乏有效性,可能是由于无法在坚实的理论和经验基础上充分地构建行为造成的。

Baker(1986)和Campbell(1986)分别比较了使用行为列表和使用行为锚评分量尺(BARS)得出的指标评分(行为锚计分量尺是一种包含数量等级和特定行为,代表好、中、差的行为表现的计分形式)。Baker发现,对于无领导小组讨论,通过行为列表得出的练习内指标评分有更高的区分效度,而对于有角色的小组讨论则通过BARS得出的练习内指标评分有更高的区分效度。而且,对两种类型的小组讨论,行为列表的方法在练习内具有更高的指标间相关性。Campbell则发现BARS具有很高的区分效度,但两种形式都没有表现出高的聚敛效度。

总的来看,这三个研究都指出了各种评分形式对评分者判断产生的影响。然而,这些缺乏一致性的研究数据无法决定是否存在一种“优异的”

评分形式。对绩效评估的研究(Bernardin&Beatty,1984;Murphy&Cleveland,1991)也得出了相同的结论,即没有一种形式比其他更为优越。

练习评分

在研究者看到练习内指标评分存在的问题后,有人提出应该放弃对单个指标评分,代之以对某个练习中的表现进行总体评分——在评鉴中心里加入一个测评师对每个练习中的总体表现进行打分的全新的步骤。我们应当分析这种总体评分的质量并讨论他们的价值,之后这种变化才有可能得到广泛承认。

测评师的一致性

表6.4列出了一个有代表性的研究,研究分析了几个评分者之间就不同练习中的表现达成的一致性。研究显示:无领导小组讨论和商业游戏的一致性高低不一,角色扮演和公文筐练习的一致性很高,而演讲的一致性则较低。在Borman(1982)的报告中所有六种练习的平均一致性为0.76。

这些研究表明不同的测评师在评价练习整体表现时表现得比较一致。此外,测评师似乎对某些练习中达成一致的程度要胜过其他练习,但是对这种现象还没有合理的解释。

在两种不同类型的测评师之间的一致性同样得到了测量。Greenwood和McNamara(1967)发现,专业和非专业的观察者的组间一致性为0.12到0.81。尽管一些信度很低,但两种类型的测评师在评分者信度上并没有显着差异。Gatewood等则研究了一组有经验的测评师和三组经验相对欠缺的测评师之间的一致性——组间的一致性为0.66到0.84。两个研究都表明“专家”和“非专家”都赞同彼此对于练习整体表现的评价,尽管在一些对比中这种一致性比较低。

预测准确性

Bray和Grant(1966)发现,测评师对于无领导小组讨论、商业游戏和公文筐练习的整体表现的评价不仅与对测评对象的许多更宽泛的评价存在着相关(相关系数从0.3到0.5),还和对测评对象管理潜质的评价存在相关。Konz(1988)发现所有九种练习的评分和测评总体得分存在相关。与此相同,许多其他的研究(Borman,1982;Tziner和Dolan,1982)也发现单项练习中的得分和最终的测评得分存在相关。Borman(1982)以及Tziner和Dolan(1982)则发现练习间评分和培训中的表现存在高相关,但Borman,Eaton,Bryan和Rosse(1987)却又没有发现这样的结论。

支持练习评分和工作行为的相关性的证据相对较少。Wollowick和McNamara(1969)发现两组练习以及一个公文筐练习同管理级别的变化有显着相关,但Outcalt(1988)发现有五组练习只是和工作级别或薪水级别的改变有轻微的相关。另外三个练习中则并未发现工作业绩和练习评分之间有练习评分相关,或者仅仅只有低相关(Hinrichs&Haanpera,1976b;Konz,1988;Outcalt,1988)。

这样,练习评分似乎可以准确地预测最终的测评得分,并且对于培训中的表现也是一个比较准确的衡量指标。然而,练习评分和最终的测评得分只是最低程度的相关,并且他们和后续的晋升以及业绩的相关关系太低,目前尚难以保证其应用的价值。

其他关于准确性的证据

有五个研究检验了几种练习的评分之间的关系,来考察不同的练习能在多大程度上测量相同或不同的概念:Konz(1988)研究了九种练习的评分,发现平均相关系数为0.21;Borman(1982)发现,四种练习中的评分中涉及一对一的角色扮演的彼此相关性最高(平均为0.48),而结构化面试和单个公文筐练习的评分和其他练习的相关性最低(和其他四个练习平均相关系数为0.26);另一个研究(Tziner&Dolan,1982)发现,五种不同的练习的相关系数从0.38到0.63,其中无领导小组讨论和角色扮演练习最为相似;Bray和Grant(1966)发现商业游戏的评分(以及评级)和无领导小组讨论评分的相关系数中等;Moses(1973)则经过研究得出结论,评鉴中心过程中的某个竞争性团队练习与合作性团队练习存在中等的相关。

总而言之,似乎对不同练习中表现的评分彼此间存在中等程度的相关,并且相似练习之间的评分相关性(如小组练习)要比不相似练习(如小组练习和个人练习)之间的评分相关程度高得多。练习评分的相似性可能由实际表现出来的相似性造成,也可能由某种人为倾向性造成。这些倾向性可能和一些批判观点所认为的“导致练习内指标评分高相关的倾向性”类似。

练习评分的准确性也可以通过检验他们和其他变量的相关性来衡量。

Borman(1982)发现,测评师的评价和第一印象、外表以及喜好程度的相关很低。这些发现能够得到有力的解释,因为整体的练习评分并不测量无关变量。Tziner和Dolan(1982)则发现在五种测评练习和三种智力测验之间存在0.30的相关,这些结果表明高智力的测评对象比智力相对较低的测评对象总体上获得的测评分数更高。

这样,尽管练习评分可能反映了表面特征(例如外表)以外的东西,智力可能仍是一个影响练习评分的潜在的因素。这些研究发现支持了Klimoski和Brickner的假设(1987),即评鉴中心测量了管理智力(managerialIntelligence)。然而,我们需要更多的此类研究,以便我们能够得到关于练习评分的内在因素的更为可靠的结论。

对其他方法的评论

很显然我并不支持对传统评鉴中心过程的修正。已经尝试的这些变革仍然没有得到充分的研究来赢得赞同。更多的研究可能会证明它们的效用,而它们也可能确会大受欢迎,但迄今为止,我们仍应当非常小心地对待传统方法的变式,并且我们应当以质疑的眼光看待它们。当然,这并非意味着我们无法为测评师提供许多的辅助手段来帮助他们培训、判断和最终做出评估。事实上,这些辅助手段在本书中多次被提到。

本章小结

这一章给出了大量关于测评师如何观察、界定和评估行为的实践、研究和理论。对于评鉴中心的各个步骤有各种支持证据:一些理论和研究证明了这些过程的准确性,其他一些理论和研究则不然。这些非支持性的证据表明,有必要改进评鉴中心方法,并且人们提出了许多变式。

从目前的一些实际操作中,我们可以看出一个趋势,即在评鉴中心过程中后期的步骤在一致性和准确性上更高,这些步骤中大量的数据得以积累。换言之,单个测评师在评价单个练习中单个维度上少量行为时的准确性并非很高。相对的,当对许多练习中的多个样本的行为做出判断时,准确性会大大提升。例如,对总体得分的评价的准确性和一致性要比练习内评分高。

我们会在下一章再度提到这种趋势,其中我们将会检验并整合若干位测评师判断的过程。有证据将会更清楚的表明,最终的对单个维度的评分和整体的评分会有更高的一致性和准确性。

这一章对理论和研究的回顾得出了如下结论:测评师能够并且的确在评价参与者表现时遵循一种行为取向的方法。评鉴中心方法和以下几方面的理论判断是基本一致的:1)特定行为事件对人类知觉的影响;2)记忆关于个体行为事件的细节信息;3)观察者使用特定的行为信息来评价给定维度上行为表现的能力。

尽管关于评鉴中心过程中如何观察和界定行为的研究并不多,对于测评师判断的研究仍然提供了支持性和非支持性的证据。这些证据表明测评师进行评分的能力是可靠的。从积极的角度来讲,测评师最终的评分显示了一定的一致性及测评结果与后续工作业绩的关联效度。另一方面,练习内指标评分的信度各异,聚敛效度和一致性无法证明其在测量单个管理才能上具有准确性。对此,主要原因似乎是练习内指标评分和该练习内其他指标评分的相关系数高于它和其他练习相同指标上评分的相关性。这种关系模式并不如它乍看上去那么糟糕,因为研究表明这些发现可能是所使用的评鉴中心方法本身造成的。如果使用行为报告法(相对于练习内指标评分法),测评师似乎能够将他们的观察和指标更一致地结合在一起,但是这样测评师能够处理的指标数量就很有限——测评师很可能在观察和界定行为时,对六个或七个指标难以给出有意义的区分。

用以证明练习内评分无法准确测量单个管理特质的证据可能有用,也可能没用。这取决于评鉴中心的目的到底是什么。如果评鉴中心的目的是对预测个体的发展,那么单个指标评分的准确性是次要的,单个指标的评分只是一种在得出总体评论之前将评分结构化的手段。如果评鉴中心的目的是给出单项能力的优势或发展需求诊断,那么我们需要对这些单项指标做更为精确的测量。在这种情况下,评鉴中心的设计必须做到:能够对单项指标进行准确的测量、必须明确每个指标的定义、对测评师进行充分的培训、必须保证有足够的练习对每个单项指标进行测量从而获得大量的信息;建议采用行为报告法。

推荐在评鉴中心过程中使用行为报告法,主要原因在于:这种方法会影响测评师讨论和整合信息的过程。下一章会专门论述测评师讨论的过程。

第六章论述了每一个测评师进行观察和界定行为,回忆信息以及对评鉴中心的表现下判断的过程。上一章还描述了一个测评师如何在整合讨论中汇报他们的观察结果,然后形成初步的整体评分。至此,我们所探讨的仍然是个人判断的必要组成部分。接下来我们将会转向团体过程,在这其中测评师将整合他们的个人判断。

评鉴中心操作

评鉴中心过程的最后一步涉及团体决策。测评师聚到一起讨论初步的整体指标评分,并且形成最后的意见。这样,在一些评鉴中心里,这些指标评分被整合到一起,形成一个整体测评评分。

获得最终的整体指标评分

测评师们将就他们初步的整体指标评分进行交流(通常将它们放到一个书写板上),并依次讨论来解决分歧。其中会产生几种可能的评分模式:

当存在整体的一致性时(例如所有测评师都给了4分),这样整合过程就很直接,参与者就得到了4分;另一方面,如果在评分之间有区别,那么有必要进行讨论。也许有人会认为这个阶段达成一致是很有必要的,但也有些关于团体讨论的研究表明,这个阶段的不一致可能是有益的,并且可以导致最终的讨论中准确性大大提高(Libby,Trotman&Zimmer,1987;Rohrbaugh,1979;Sniezek&Henry,1989)。“不一致”的背后可能存在着多种可以导致决策更佳的有效意见(Wanous&Yountz,1986)。

传统的评鉴中心法需要团体达成一致。在这种背景下,一致性意味着每一个测评师都能够接受评分,并视其为对行为表现的一种充分的表征。

当然,一致性并不意味着每一个测评师都需在评分上达成完全一致。

同类推荐
  • 中层管理者的行动指南

    中层管理者的行动指南

    企业的中层管理者起着承上启下、上传下达的作用,他们需要具有执行力,需要具有管理能力和领导力。中层管理者需要理解、领会高层管理者的经营战略,将其在自己的团队中贯彻执行。本书针对中层管理者的职位特点和要求,从认识中层管理者角色、自控、执行、管理、解决问题、沟通、合作、创新、超越等10个方面阐述了中层管理者应该具备的岗位能力,以及怎样锻炼出这些能力。
  • 销售要懂微表情

    销售要懂微表情

    作为销售人员,如果能够学会从客户的“微表情”“微行为”中判断出客户的真实想法,就可以摆脱无所适从的困惑,提高辨别客户的能力,顺利地窥探出客户的情感变化,找寻出令客户迟疑的真正原因,从而让成交变得轻而易举。本书教给销售人员如何通过观察客户的微表情、微行为来感受客户的思维、感觉和意愿,如何运用自身细微的肢体语言来向客户传达信息,从而实现有效沟通,促成交易。
  • 王石是怎样炼成的

    王石是怎样炼成的

    真正企业经营管理的切身体会,对市场的判断和预测,都是意会多于言传的事情。而擅长逆向思维、不愿人云亦云的王石,既没有太多的企业哲学和复杂的产业理论体系,也很少愿意按照公众的话语逻辑发言。所以,从某种意义上说,对于王石,公众存在着一定程度上的误读,这是正常现象。
  • 卓越之道:杰出人物领导艺术全书

    卓越之道:杰出人物领导艺术全书

    在人类漫长的历史长河中曾经涌现出了无数的杰出人物,正是他们用他们卓越的领导艺术改变了历史,领导着那个时代的人民坚定而勇敢地前进。而今天,我们应该乐于从这些曾经改变了人类发展历史进程的杰出人物的事迹中汲取智慧和力量;更应该乐于从他们的事迹中去学习他们的思想和品德,铭己之心,壮己之志。"
  • 与众不同的滚雪球高手

    与众不同的滚雪球高手

    会把财富越做越大绝对是滚雪球高手。财富无处不在,全凭你的慧眼发现。财富的积累与创造关键在于独到的方法与本领,为什么屹立于群山之巅的财富巨人能一览众山小,鸟瞰芸芸众生。把世界的大部分财富揽于怀中。他们对财富攫取的方式方法向人们提供了全新的思路与方略。会滚冒球者才能领略滚雪球间的乐趣与奥妙。当财富还如雪花一样散落于各个角落,我们何不也去做一个滚雪球的高手呢?《与众不同的滚雪球高手》的作者是张大羽。
热门推荐
  • 我喜欢你,关你何事

    我喜欢你,关你何事

    喜欢一个人,不必强求,喜欢便好我喜欢你是我的自由,你嘛,爱咋咋地
  • 网游之锋芒无双

    网游之锋芒无双

    高手是什么样子?我这样。(简介虽然简单,但是请大家放心阅读,这是一个精彩的故事,你想要的,这里都有。)
  • 屌丝逆袭:虐渣女主

    屌丝逆袭:虐渣女主

    本文为快穿系统文,女主是个只可远观不可近玩的伪女神,本文或许很坑,但希望念在我第一次写文,大家手下留情!
  • 天域战皇

    天域战皇

    天域战神苏沐,因参悟轮回失败,导致堕落无尽深渊,尘封万年。一朝觉醒,便浴火重生!转世幻灵国苏王府苏家大少,结果却是个命轮残缺的废物!强者?弱者?只是一念之间!挡我者,弑!神佛因我颤栗、大地为我颤抖、万兽惧我狰狞、群雄恐我陨落!傲娇女王、乖巧萝莉、病娇女神。统统尽收!这次,他要再次杀向天域,成诸圣主宰,睥睨天下英雄!无上之王,天域战皇!废人…永不言败!
  • 我的呆呆小萌夫

    我的呆呆小萌夫

    这是一部关于救赎与被救赎的治愈系小萌文。“娘子,娘子,小花说娘子要把我休了。”某萌扯着自家娘子的衣袖,委屈的说着。某女拿开盖在脸上挡阳光的《女戒》:“萌萌乖,为妻是不会休你的啦。”“可是,可是小花说娘子嫌弃萌萌是傻子,娘子会嫁给他的。呜呜,萌萌不要娘子嫁给别人。”某只萌萌伤心的说。某女摸摸某萌的头:“安啦,小花那么招摇,我是不会要他的,我只要萌萌啦。”某女眯了眯眼睛,这该死的花狐狸,又吓这小白兔。得到自家娘子承诺的某萌,屁颠屁颠的跑出去:哼,娘子才不会不要他呢!得要去和小花说娘子才不喜欢他呢!娘子最最爱自己。听说某世子伤心许久,整个大金国女子都想找出那该死的罪魁祸首。
  • 玉笙犹恋碧桃花

    玉笙犹恋碧桃花

    1920年的冬天,蒋碧雯因为在英国的生活难以为继,揣着从同学处借来的两百块,回到了上海。曾经上海滩的赫赫名媛,如今家道中落,先是被堂姐抢走了青梅竹马的未婚夫,自己的未婚夫突然变成了自己的姐夫,堂姐曾经的未婚夫又喜欢上自己……受到伯母的苛责出门找工作,遇到了温文尔雅的国文先生,在他的帮助下,自己成了一名美术教员,然而国文先生却被诬陷为强奸犯……好不容易遇到了一个英俊不凡的报社主笔,可他却是一个革命者……
  • 漂流手记

    漂流手记

    张晓明从最初身上只剩下三十元,而后奋斗有了自己的事业,这一路走来,他不知道忍受了多少屈辱,和多少汗水,然而,上天好像偏偏和他作对,就在他事业巅峰的时候……
  • 穿越努力发家当地主

    穿越努力发家当地主

    咦,穿了吗?包子爹娘,欺人的亲戚,看我如何分家,带领一家人发家致富。你是哪来的,看在你对我死心塌地的份上就勉强收了你吧
  • 回望点滴

    回望点滴

    读想读的书,听想听的课,学想学的知识,做想做的事,成为想成为的人。我希望学习、修身、养性,我希望心安理得、快乐自得、问心无愧。
  • 邪帝独宠:痴傻五小姐

    邪帝独宠:痴傻五小姐

    她是摄政王府嫡出五小姐,却痴傻愚钝,人人唾弃。她是异世的王牌特工,性情冷漠且狠辣,人人畏惧。一个在大街上示爱,被渣男一掌打死,一个却被好友背叛,遭暗算意外身亡。当软弱痴傻的身份融入强悍冷血的灵魂,天地变色。而他明里是不受重视的病弱皇子,暗里却掌控着令人胆寒的暗阁。他常年以面具示人,忍辱负重,筹谋大业。可她的出现却成了他计划中最大的变数。最后她冷言问他:“你要我,还是要江山?”他目光坚定:“你,我要。江山打下来给你。”【情节虚构,请勿模仿】