评价方法是人们为了认识教育活动的价值,以教育活动的某一要素或全部活动为对象进行价值判断所采取的活动方式、程序和手段的总称。① 它是在人们评价活动实践中形成的,指为解决评价活动中的各种问题,保证评价活动正常进行,实现既定评价目的所采取的方式方法。“工欲善其事,必先利其器”,教育评价目标必须借助一定的评价方法才能实现。评价方法是教育评价活动中的重要因素,其恰当与否在一定程度上决定着评价活动的成败。
在评价活动中,若没有符合评价自身特点和具体目的要求的科学方法,就不可能取得理想的活动效果,实现预期的评价目的。评价方法在评价活动中的重要地位,是由评价方法与评价原理、实践、目的之间的特定关系所决定的。
从根本上讲,任何一种评价方法都是针对实现一定评价目的而提出的,是实现评价目的所必需的手段或措施。依据不同的分类标准,可以对评价方法进行不同的分类。
一、根据评价的表现方式不同,可以分为量化评价和质性评价
(一)量化评价
量化评价指的是运用客观的评价标准和工具,对评价对象采用量化的方式用数量化的结果作出推断描述的评价。它主要用实验、测验、观察、调查等方法进行评价,对评价的严密性、客观性、价值中立提出了严格的要求,力求得到绝对客观的事实。例如,我们当前评价中的考试评价,依据分数对学生的学科知识和学科技能进行评价,采用百分制评价方式描述评价结果,如小李考“95分”、小红考“83分”,小明考“78分”,就属于典型的量化评价。还有我们对小明和小红的研究性学习给予“优”、“良”、“及格”、“不及格”等等级的评价分数,也是一种量化评价。量化评价的方法具有具体性、精确性和可验证性等特点。
(二)质性评价
质性评价指的是采用开放的形式获得评价信息,作出评价判断的方法。如通过对学生学习的行为表现,对其学习状况进行分析和评价。例如现在兴起的成长记录袋评价法,是目前国际评价界所推崇的一种质性评价方式。由于其基本思想与我国目前的新课程改革理念非常一致,因而这种评价方式近几年在我国开始广泛使用。成长记录袋评价的主要依据就是学生的作业等各种作品,展示学生在一个或多个领域的学习过程中所作的努力和取得的进步。还有目前比较倡导的表现性评价法、苏格拉底式研讨法等均属于质性评价法。
量化评价与质性评价两种评价方法一直受到人们的争论。在20世纪,伴随着教育测量学的发展,教育评价追求的是科学范式下的量化,试图用客观的标准,将复杂的评价现象简单抽象为数量形式,将不能量化的现象都摒弃在评价范围之外,但是这种评价方式并不能完全反映出被评价者的发展状况。因此,对这种简单量化的评价方式的声讨此起彼伏。但是质性评价的“科学化”问题一直受到人们的怀疑,因为质性评价往往容易受到评价者主观感受的干扰,难免会使人对其评价的客观性产生怀疑。
量化评价与质性评价虽然是两种不同的评价方法,但是它们是教育评价的两翼,不是非此即彼的关系。不同的评价方法能针对学生的不同侧面进行有效评价,每一种评价方式都有其优势与不足,不可能用一种评价方法满足人们多元化和多层次的评价需要,所以我们必须要学会在恰当的时候选择恰当的方法来进行恰当的评价。但是实际上要达到这个要求的评价方式是很难的,所以我们不能简单认为哪种评价的优劣与否,关键的是我们如何根据评价方法的特点和学生的个体差异,选择与评价目标相符合的评价方法,有效地运用这些评价,真正促进学生发展,发挥评价的巨大功能。
二、按对评价结果解释的标准不同,可分为常模参照评价与标准参照评价
(一)常模参照评价
常模参照评价常常也称为相对评价,是指以某一受测团体的评价结果的分布状况为基准,一个学生的测量分数通过与这个团体其他人的测量分数相比较来进行解释,即解释为学生的分数在既定群体中的相对位置(如,写作水平优于班中50%的人)。常模参照评价中用于比较和解释测验结果的参照分数标准就是常模。学生的测验分数必须与定义为常模的学生分数比较,才能对测验的分数进行解释。依据结果的用途,常模可能以一个地区、省或全国为基础。根据常模的选定范围,常模参照测验就可以根据学生的相对成就水平作出决策,如选拔、分组和划分等级。
常模参照评价的基本特性是比较,可以使个体客观地判断自己在团体中的优劣情况,同时,也有助于树立竞争意识。但是,相对评价不注重成员是否完成既定的教学目标,结果导致成员之间争名次,忽略了自身素质的提高。
(二)标准参照评价
标准参照评价常常也称为绝对评价,是指参照事先设定的标准,看学生是否达到标准以及达到标准的程度。标准参照评价对测量所得的分数的解释是依据教学目标或学习任务的确切范围。它主要不是用于比较个人之间的差异,而是描述学生所掌握的具体知识及技能。标准参照评价结果的解释可由不同方式作出。我们可以描述学生所能从事的具体的学习任务(如可以制作昆虫标本);也可以指出学生正确完成任务的百分比。或将测验中的表现情况与一套行为标准相比较并判断它是否达到某一标准,比如,在基于标准的教学中,评价与具体的内容标准相结合,而且在确定的行为标准的基础之上,它使用学生行为表现的水平对结果进行报告。比如,评价结果可用3到5个行为表现水平进行报告,如,较熟练、熟练和精通几个水平。
标准参照评价因为有一个共同的客观标准,所以学生可以通过同这个既定标准对比,判断自己的学业水平。但是,由于评价标准容易受到评价主体主观因素的影响,有时评价的结果难以做到与标准完全一样。
尽管常模参照评价与标准参照评价都可以使用分数进行解释,但两者使用的意义是截然不同的。以通过确定群体中得到相同或更低分数的学生的百分比为例,常模参照评价结果的解释指出了学生在群体中的相对位置;标准参照评价结果的解释则关注答对项目的百分比。对百分比解释的不同体现了常模参照评价和标准参照评价的不同解释标准。
三、按照评价的时间和作用不同,可分为安置性评价、形成性评价、诊断性评价和总结性评价
(一)安置性评价
一般在教学开始时进行,以确定学生在学习开始时的情况。在教学开始前关注如下问题:(1)学生具有进行有计划的教学所需的知识和技能了吗?(2)对于要实施的计划教学来说,学生的准备状况如何?(3)学生的兴趣、学习习惯及个性特征达到了何种程度,需要什么样的教学模式来与之相匹配?安置性评价的目的是确定每个学生在教学进程中的位置以及最有用的教学模式。
(二)形成性评价
一般在教学过程中进行,用于定期检测学生的进步。形成性评价是通过诊断教育方案计划、教育过程与活动中存在的问题,为正在进行的教育活动提供反馈信息,以提高正在进行的教育活动质量的评价。① 它的目的不是为了对学习者分等级和鉴定,而是帮助学生和教师把注意力集中在为进一步提高所必须进行的进一步学习上。所以形成性评价更多的是具有改进的功能。
(三)诊断性评价
它一般在教学过程中进行,用于诊断学生学习是否存在困难和问题。如果在教学过程中,有学生通过形成性评价发现学习进步很小甚至没有进步,进行教师一般的教学干预还是没有达到理想的效果,这时对学生需要采用专门的诊断性评价。诊断性评价是一个专业化程度较高的方法,比如学生在阅读上存在问题,我们可以采用专门的阅读诊断性测验,了解学生阅读问题的原因,是不是有阅读障碍存在?是什么类型的阅读障碍?需要什么样的针对性干预措施?诊断性评价的目的是确定那些持久的学习问题的成因并且设计出矫正方案。
(四)终结性评价
总结性评价是指教育活动告一段落或完成以后对其效果进行的评价。布卢姆认为总结性评价是“指向更一般的等级评价”。总结性评价的直接目的是作出教育效果的判断,从而区别优劣,分出等级或鉴定合格与否,它的直接目的指向最终教育效果。
长时间以来,我们往往只注重总结性评价,忽视安置性评价、形成性评价和诊断性评价。目前,随着评价改革的深入,大家越来越关注除总结性评价之外其他评价方法的使用,特别是形成性评价的作用。但大家对形成性和总结性评价两者往往不能很好地区别。形成性评价和终结性评价的区别主要表现在:
第一,形成性评价是在过程中定期进行的评价;终结性评价是在一段较长时间后测查最终结果,因此它是对教育活动全过程的检验。
第二,形成性评价能及时地发现学生学习中的问题;终结性评价在学习完成后进行,主要目的是评定学生成绩。
第三,形成性评价关注个人一个阶段的学习目标,往往测查的是一个单元或某一部分的学习;终结性评价测查的是几个单元的学习,经常包括长期的学习目标,终结性评价对学生能力的概括水平高于形成性评价。
第四,形成性评价较多反映学生个人的进步;终结性评价可用于学生成绩间的比较。
形成性评价和终结性评价通常可以一起使用,形成性评价能提供及时的、定期的反馈,而终结性评价在更多情况下展示的是最后的学习结果。在教师进行新内容的教学之前,可以借助于形成性评价,以了解学生是否已经达到一定的水平。形成性评价还可以检查学生知识的掌握情况,从而帮助学生决定是要继续复习还是要进行新内容的学习。
四、按评价的功能不同,可以分为选拔性评价、水平性评价和发展性评价
(一)选拔性评价
选拔性评价是通过衡量学生的学习成绩,甄别出更有利于接受某方面教育或继续某方面学习的对象,使教育资源更合理配置,实现评价的选拔淘汰功能。所以,选拔性评价注重的是最终的结果,其功能凸显于甄别、选拔适合进一步教育的学生,注重给学生打分数、排名次等。
(二)水平性评价
水平性评价一般是在某一段教学活动结束后,为了解学生学习的最终效果而进行的评价。学期中或学期末进行的各科考试、考核都属于这种评价,其目的是检验学生的学业达到了哪一个水平。水平性评价注重考查学生掌握某门学科的整体程度,概括水平较高,测验内容范围较广,并对学生的某个时期的学习成果作出整体评定。
水平性评价和选拔性评价的内容相当局限,只能通过试卷测验学生对书本知识的记忆和考查学生能否解决某些人为设计好的问题;其二,其考查内容仅局限于数理逻辑能力水平和语言能力水平的判断上。而事实上,人的智能是多元的,智能的其他方面在人的发展中同样具有重要的地位,但它们却无法通过书面考试去进行水平认定和选拔。
(三)发展性评价
发展性评价是指以学生发展的进程为对象的评价,其目的是促进学生持续全面的发展。具体来说可以表述为,以促进学生发展为导向,运用现代教育评价的理论、技术和方法,对学生发展现状及潜能进行系统分析与价值判断,进而激发和培养学生自主发展的意识和能力,最终促使学生成为持续发展的个体的教育评价活动。所以,发展性评价是一种面向未来的评价,以形成性评价和诊断性评价为主,注重评价的“增值”功能。同时,发展性评价也是持续开展的动态进程,注重在发展过程中多次、即时、动态地实施评价,把终结性评价与形成性评价有机地结合起来,从而促进学生在原有基础上不断提高与进步。
发展性评价强调评价理念的转变,与之相适应,评价形式、方法必定会有所创新,但并不完全排除传统评价的基本技术和方法。从信息的收集、评价计划的确定、指标体系的制订,到评价的实施,原有教育评价的很多方法、手段都可以采用。与单纯的水平性评价和选拔性评价相比,其特殊性更多地表现在评价价值观的改变以及对评价结果的不同的解释和利用上。