一、评价与相关概念辨析
要想正确地理解教育评价、揭示教育评价的含义,必须首先弄清“评价”、“测量”、“测验”这三个词的含义。
许多时候,评价似乎和测量、测验是同义词,例如,当一个教师进行一次测验时,我们可以说他是在“评价”学生的成绩,我们也可以说他在“测量”、“测验”学生的成绩。但事实上,这三个概念既有区别又有联系。
著名的测量学家史蒂文斯曾对测量下过一个定义:测量就是按照一定的法则给事物指派数字。测量就是用数学方法对事物及其相关属性进行数量化描述的过程,即是对个体拥有某一特征的程度进行量化描述的过程。对学生评价而言,测量就是对学生学习结果的定量描述。而测验通常是指通过在相同的条件下实施一套问题来测量一个行为样组的一种工具或系统性方法。因此,测验仅仅是测量的一种形式。测验常常可以分为标准化测验和教师自编测验。教育测量学上常常通过标准化测验达到对事物及其属性量化的目的,这种量化结果往往比较可信、准确性也较高。但日常教学中,我们也把教师组织的考试称之为测验,这种测验其标准化程度和测量学家编制的标准化测验如智力测验、人格测验、成就测验是有区别的,但对了解和评价学生掌握的知识和技能状况却是十分有意义的,我们可以称之为教师自编测验。在我国的中小学校经常进行这种测验,如学生在学校会有期末考试、期中考试、单元测验和随堂小测验等等。这些测验都是为了让教师了解学生究竟学到了些什么,学生们对教师所教的知识和技能的掌握水平如何。如果教师对学生目前的学习水平了如指掌,就能够做到根据学生的实际掌握情况,调整自己的教学,更合理、更有针对性地改善学生的学习。一般,测验的主要形式有论文题、选择题和判断题等,这些测验形式在课堂评价中普遍使用。伴随着素质教育的提出与新课程改革的实施,许多新的测验方法在我国正逐渐为人们所认识,教师可以采用更加科学有效、丰富多样的工具来评价学生学习与发展的状况。
“评价”一词,来自于拉丁词根“assidere”,意为“旁边就座”,意思是说评价必须是透过旁人作出的。评价是指评价者采用各种方法收集信息来了解被评价者表现的过程。我们对学生的评价就是指使用各种方法获取关于学生表现的信息,这些方法包括纸笔测验及开放性回答(如论文)和对真实任务的操作(如调查校园内的环境污染情况)、问卷等等。我们对学生的评价需要学生、家长和教师间的合作,要求使用多种指标从多种渠道收集信息,如从学生、家长和教师那里评估学生们的进步。通过评价,我们可以了解学生获得了多少知识?学生的阅读能力如何?学生对分数运算掌握到什么程度?学生的学习进步了吗?学生的学习态度积极吗?学生对学习有兴趣吗?? ?评价不仅仅包括量化的结果,也包括对结果的价值判断。
与测量或测验相比,评价是一个综合性和概括性更强的术语。测量限于对学生的量化描述,即,测量结果总是用数字表达(如,在30道数学题中小李答对了25道)。它既不包括定性的描述也不包括对所得结果的价值判断。但评价可以包括对学生的定量描述(测量)和定性描述(非测量)。此外,评价总是包含对结果的价值判断。体现了评价的综合性以及测量与非测量手段在评价过程中的作用。如图所示,评价可以依据测量的结果,也可以不依据测量的结果;当以测量为基础时,它超出了定量描述的范围。
综上所述,评价从根本上讲是通过多种途径收集各种信息对被评价者进行评定的过程。评价是相对教师所做的测验与测量而言更为宽泛、限制性更小的一种说法。这就告诉我们,对学生的评价不只是纸笔测验一种形式,还包括许多其他的测量与非测量方法。
教育评价就是根据一定的教育价值观或教育目标,运用可行的科学手段,通过系统的收集信息资料和分析整理,对教育活动、教育过程和教育结果进行价值判断,为提高教育质量和教育决策提供依据的过程。
教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测定,为教育评价提供依据,是教育评价信息的主要来源。如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息。①
教育测验是对人的知识、技能和能力以及其他某些心理特征进行检测的工具和手段。教育测验是教育评价获得评价信息的工具和手段之一,通常教育评价获取信息的测验法就是指教育评价借助教育测验获取相关信息。
教育评价不仅要借助教育测验、教育测量进行量的测定和分析,而且要进行质的分析,把所有与评价目标相关材料和分析综合起来。教育评价行为是建立在事实判断基础上的价值判断。教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而获得的结果或结论,按其价值取向进行合乎逻辑的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论的过程,是一个由事实判断向价值判断的变化过程。当然,我们不能说教育测验丝毫没有价值判断,如在测验什么、不测验什么的问题上就需要进行价值判断;同样,我们也不能说教育评论就没有事实判断,教育评论需要通过事实判断的真凭实据作论据。
二、教育评价的本质
一般说来,测验、评价的目的是为了推断学生是否掌握所教知识和技能,评价学生的态度和兴趣。教师需要根据这些信息作出适合每个学生的合理的决策。例如,如果一个学生已经掌握了一项重要的数学技能,教师可以通过小测验的形式来确定他是否真的掌握了,然后教师就可以继续教给学生其他的数学内容。再比如,如果一位学生在一个课堂测验中表明他已经掌握了九九乘法表,那么他的教师就没有必要再教给他关于6乘以7的知识。这就是课堂测验的主要任务,即捕捉教师需要的信息,帮助他们更好地作出教育决策。
评价在本质上是一种推论,教师应该从学生所学的知识和技能中抽样来编制测验项目,他们选择的测验项目应该代表学生所学的知识和技能的重点。基于学生在测验上的表现,教师就能够对学生掌握这些重点知识的程度作出推论。基于这些推论,教师作出以后怎样更好地教学生的决策。换一种方式来说,学生在测验上的表现,能够帮助教师对他们掌握知识技能的情况作出推论。比如,教师不能仅仅通过观察来判断一个学生是否会写一篇议论文。但是如果教师在期末考试中让学生写两篇议论文,而且他的两篇论文都写得很好,这时教师就能合理地作出推论,即推论这个学生能写议论文。通常,教师评价学生是为了确定学生达到教育目标的程度。换言之,教师想知道学生的学习水平,即是否获得教师预期的学习结果。一般来说,这些结果是认知方面的,如,学生对知识和技能的掌握。但是,预期的结果还包括情感方面的,例如,教师试图培养学生特定的态度和兴趣。当然,在诸如艺术和体育领域中,教师关注的是提高学生的运动技能。演示了教育过程中内容、评价、推论和决策的理想关系。这里的“内容”指的是学生所学知识和技能的综合体———有时也包括情感维度的东西———这也就是教师教学的目标所在。评价测验就是从学生所学的重点知识中取样形成的。
无论教师预期的教育结果是认知方面的,还是情感或技能方面的,教师都需要确定与特定的教育结果有关的学生的状态,即教学目标。教学目标中的每一项都包含非常丰富的内容。例如,让我们试想一下与学生解决数学问题的能力有关的认知领域,我们可以构想出各种各样的数学问题,而学生则必须能熟练地解决这些问题。这些各种各样的问题构成了一个庞大的教学领域。同样,与学生在同伴面前进行口头表达的自信心有关的情感领域也涵盖了口头沟通的广阔范围,它包括短暂的即席演讲或正式的就职演说所需要的自信。此外,在与严密防守条件下投篮有关的运动技能领域,既有球场中出球位置的选择,又包括防守队员不同严密防守方式的运用。简言之,几乎任何一个真正重要的教学目标领域都非常丰富,全部内容都进行测验所花费的时间很长,所以在实践中教师很难通过评价这些领域的所有内容来确定学生的状况。因此,教师可以从所有这些目标领域中抽样选取有代表性的教学目标,以此作为课堂评价真正应该实施的内容。课堂评价被教师用来确定学生达到预期教学目标的状况。例如,要测试学生是否知道导致中国抗日战争的全部重要历史事件,将会耗费太多时间,因此教师的课堂评价应该对这些内容进行取样。由此可知,课堂测验的取样内容仅仅是教学目标领域中全部内容的代表。
学生在测验中的表现是一种表明学生达到预期教学目标的程度与水平的标志。所以教师实施测验的目的并不应该仅局限于学生在课堂测验中的表现本身,而应该利用这一结论来制定今后的教学决策。
以上这一复杂过程我们可以用一个链接来清楚地解释:代表教学目标的课堂评价,导致教师关于学生达到目标程度的推论,进而产生教师的教学决策。许多教师主要将测验当作是给学生评定等级的工具。学生的等级与其在测验中的表现是有联系的,即在需要评定等级时,教师将获得的大量的测验结果转换为等级。但是,测验作为等级评定工具的角色无疑应该是次要的。评价最主要的功能应该是有助于教师作出更好的教学决策。