绩效评估与电子档案袋:对教师学习及教育的作用(上)
北京师范大学比较教育研究中心 唐霞
摘要:近年来,政策制订者们开始重新审视对教师质量的界定,其关注焦点转移到对教师能力与学生成绩评估的关系考察上。在这种政策背景下,加州给教师提供了一个独一无二的机会,考察新立法标准基础之上的评估活动所带来的冲击,这是一种高风险的评估体系,可在教师资格及项目认证当中使用。作者详细阐述了绩效评估及电子档案袋给教师学习及教育带来的效用。
关键词:电子档案袋,绩效评估,教师教育
过去十年以来,几乎所有州都进行了标准意义上的改革,对教师培养阶段应掌握的知识和能力做出界定。在很多州,这些教学标准都与州教师资格要求或教师教育认证活动联系在一起的。尽管各州申请教师执照方法各异,很多州都制定了标准化绩效评估体系,要求教师通过这些评估来获得教学证书。在康涅狄格和加州,绩效帮助体系(导师项目)和评估(教师档案袋)在教师资格申请起始阶段即投入使用。其他州也将绩效评估用于执照或认证目的。有的州采用的是教育考试服务(ETS)为执照设计的PRAXIS Ⅲ体系(如俄亥俄州),而其他很多州则选择参加了州际新教师评估与支持联盟(INTASC),这是一个包括37个州在内的合作组织,致力于向各州提供教师执照或项目认证之用的具体学科档案袋评估。此外,各州还采取了一系列政策措施,鼓励教师参加全美教学专业标准委员会(NBPTS),建立各学区与州的教师骨干力量。
近年来,政策制订者重新评估教师质量的概念,更多地研究教师能力评估和学生成就之间的关系。在这种政策背景下,加州给我们提供了一个独一无二的机会,来考察这项新的立法性质的标准评估运动带来的冲击,它作为一项高风险评估系统,用于教师执照及教师教育项目认证。最后,发展具有信度与效度的标准评估将进一步深入研究教师培养和学生学习之间关系。
1998年,加州要求在教师培养项目中使用绩效评估,和其他测量方式一起(如课程论文、听课)作为获得教师证书之凭证。教师证书委员会(CTC)与教育考试中心(ETS)协商制定了一套以绩效为基础的标准化评估工具。教师教育机构允许采用ETS模式以外的其他评估方法,只要符合加州教学标准同时具备信度与效度。一共16家高等教育机构组成了加州教师绩效评估联盟(PACT: Performance Assessment for California Teachers),合作开发了州评估体系之外的一套内容具体、标准化评估模式。PACT的一个关键动机就在于开发出一套严格的、透明的、具体学科的、标准化的资格证书评估工具,与成员院校课程及专业承诺一致并符合州质量评估标准。
PACT联盟努力实现教师培养过程专业化(Mayer,2005),发展教师教育组织内部的评估工具,取代ETS外部模式,同时信效度达到州评估标准。在2002-2004年间进行了超过1500份实验评估,PACT的具体学科评估工具受到广泛认可,并作为建立PACT教学活动(Teaching Event)信度及效度之基础。
PACT教学活动的设计建立在计划、说明、评估以及反思(PLAR)模式的基础上,在这个模式中,教师候选人在对学生能力和技能了解、内容的掌握及最佳教学方法基础上,计划、实施并评估教学情况。教师候选人还要围绕一个简短教学单元或学习片断完成几项内容,包括:1,对教学情境的描述;2,对一个中心议题下的三五个课程学习片断写出授课概况及设计原理;3,课程中的一或两个教学录像,并附上对每天教学及录像的评论;4,评估计划和学生功课样本分析;5,对教学及学生学习的书面反思。
2003-2004学年度,为补充具体科目的教学活动,PACT成员院校开始发展内嵌式签名评估(Embedded Signature Assessment,EAS),现在已被大多数PACT大学采纳。EAS向教师候选人以及教师督学提供形成性反馈,并做出更好的认证决策。
本文考察的是标准化档案袋评估所提供的学习机会对教师学习及教师教育的促进作用。将从两个角度来探讨学习所带来的冲击:使用纸笔方式建立档案袋、提供指导及评分的教师及教师候选人,使用电子平台方式建立档案袋、提供指导及评分的教师及教师候选人。第一部分是经验性文献,主要回顾了绩效评估给教师学习带来的冲击并说明教师学习测量方法上的难点。第二部分指出电子技术的应用引起教师知识技能考核变化以及促进教师学习带来的机遇和挑战。
一、教师绩效评估文献回顾。
20世纪80年代末,斯坦福大学教师评估项目(TAP,1987-1990)进行了绩效评估实验,并作为NBPTS评估的基础。这项工作证明建立档案袋、模拟教学任务的结构性练习以及考察教师思维的正式访谈,可以测量优秀教师和新教师之间在教学思维、分析及技能方面的差异。此外,还有一些研究不再限于测量,进而考察评估给教师专业学习带来的冲击。
在金(1991)对15位参加生物教师评估项目的研究中,教师们在一年之后表示评估对他们的教学产生了促进作用,很多评估活动曾经给他们带来了很多挑战,而在档案袋建立及模仿练习过程中,教师越来越具反思性。阿森纳(1994)的研究考察了18位参加能力教学档案袋评估教师的自我陈述报告,并对一位三年级教师的档案袋进行了个案研究,分析档案袋建立过程对教师教学和思维是如何产生影响的。在18位教师当中,16位教师表示档案袋专业测试对他们的教学产生了一定影响,而提及最常见的变化就是教师改变了对学生进步的评估方式。在对教师的个案研究基础上,阿森纳发现档案袋评估促进了教师教学实践中的一些改变,如评估学生写作的方式,对整个班级的初期及发展性评估(甚至在档案袋专业测试结束后一年仍是如此)。评估同样促使教师开始反思自身教学实践并探索其后的原因。
由于教师评估工具并非设计用来确定最低教学能力,同时参加评估的教师都有过教学经验,评估结论在新进教师身上的运用还是有一定局限的。另外,这些研究就本质而言还是属于实验性质,主要目的是检验以绩效评估区分教师教学技能的可行性,而非决定对教师专业发展的长期效应。虽然对评估给教师长期学习及实践带来的效果没有做细致研究,但这些研究发现仍有重大意义,因为它证明了教师技能可以进行区分,同时短期之内也可以得到提高。
二、全美教学专业标准理事会(NBPST)评估之效用。
对参与NBPTS资格证书过程教师的研究指出,单个教师可以通过档案袋的建立及完成评估中心活动获益良多。Tracz et al(1995)考察了教师在参加NBPTS专业测试之后,对自身教学效果感受变化情况。在这项研究当中,48位获得完全资格的教师接受了一项含37项内容的调查,对自己的教学技能进行了排序,调查时间分别为开始档案袋工作之前和评估完成之后。研究结果显示教师对教学技能的感觉发生了显著变化。在一共6大范畴的调查中(课堂组织及管理、教学计划及设计、教学、学科相关知识、学生学习诊断及评估以及作为学习化组织一员),教师的平均排序从7移至9。教师认可档案袋过程,是因为促进教师对自身教学的反省并对每天做出的决策进行再思考。在另外一项由Tracz、Sienty和Mata(1994)进行的研究中,教师表示对自身教学进行录像以及分析学生功课促使他们更多地思考如何组织教学及学习任务,评估学生学习,以及改进教学实践。
Rotberg、Futrell和Lieberman(1998)1997年对参加NBPTS评估的教师进行了电话访谈,从38位教师中抽取了28位,采访了这些教师对于评估是否促进教学技能的看法,同时考察了NBPTS标准与现实教学实践一致性问题。访谈的绝大多数教师都认为,申请NBPTS资格证书的过程对其专业发展是一个相当大的推进,尽管也有一些教师认为自己的教学在整个评估过程中没有什么变化。还有一些发现显示,实现一次成功的评估,同事及管理人员的支持是一个很重要的因素。
Sato(2000)采访了17位近来申请NBPTS资格证书的教师,发现这些教师学到了很多不同领域的知识,包括学科内容知识、教学经验、学生、自我学习以及元认知思维等。特别提到档案袋建立过程时,教师表示他们被鼓励尝试一些新的教学策略,如使用小班授课、评估资料搜集策略、新的课程资料以及不同形式的写作作业。档案袋评估还促使教师更多关注课堂内不同个体的学习需要,对教学的信仰及价值进行更深的思考,获得对实践的新的元认知理解,对教学选择的方式及原因有了很好的阐释。然而,新教师无法从这个过程中得到同样收获。在每一个领域,每个教师学到的东西都有所不同。在对教师的访谈中,Sato还调查了哪些评估方面和环境促进教师的学习机会。她发现,教师将NBPTS教学标准作为评估教学的指导框架,作为专业发展基准,同时还是分析教学选择的工具。由于评估植根于教师的课堂经验,促使教师通过检查学生功课及课堂录像更近距离考察自身教学实践。最后,教师们认为与校内其他参评教师的交往或是每月的帮助性质聚会也是很有收获的,使他们有了很多专业讨论并对工作进行及时反馈。
对NBPTST研究的一个普遍性批评就是,他们所报告的教师样本数据,其中教师都是挑选的志愿者。尽管这并不会失去研究的效度,但对档案袋过程的积极感受部分程度可由样本教师的特征来解释,这些教师有更多的寻求专业发展及改进教学实践的倾向。除此以外,研究中绝大多数都是具有教学经验的教师(申请NBPTS资格证书的教师必须具有至少3年全职教学经验),因此对于研究结论在新教师(以及职前教师)身上的运用受到质疑。
还有一个方法论上的局限,就是大部分研究都是依赖参与教师的自我陈述或是访谈,资料往往是绩效评估本身的结果(如档案袋结果)。
三、绩效评估对职前教师之效用。
对教师教育项目中绩效评估的使用情况已经有了大量研究。从80年代开始,教师教育项目就已经试用档案袋及其他绩效评估方式,这就给研究变革给职前教师学习带来的影响提供了机会。
例如,密尔沃基的Alverno College在过去20年间一直在它的教师教育项目中使用绩效评估。这些绩效评估或“展示”(包括文章、信件、论文、个案研究分析、录像、课程材料以及模拟家长会议)都包含在授课中。在一项对Alverno项目及其研究生的研究中,在学生教学及第一年的后续研究中搜集到的资料显示,合作的教师、监督人员及职前教师本身都将职前教师列入“有能力的”或“满意的”类别,其判断标准96%都来自于绩效评估。在后续研究中,校长根据五项职业教育能力判定Alverno的毕业生是“有能力的”,这五项能力分别为概念化、诊断、协同、交际以及综合作用。在Zeichner的调查研究中,包括了4年间Alverno College的96名毕业生和29位毕业生的雇主,Alverno毕业生以其反思性及学生为中心的教学受到密尔沃基地区学校校长的高度认可。
这些研究显示,测量职前教师的学习及专业实践在参加某种绩效评估之后的变化情况有多种替代方法。校长对教师绩效的排序可以作为一种更为客观的资料来源,可与教师的个人陈述综合在一起。然而,校长排序同样也受到了一些批评,认为是不可信和模糊的,缺乏差异性(因为大部分校长都认为自己的教师是胜任教学工作的),对教学实践的影响也是很少或几乎为零。由合作教师与大学监督人员根据课堂观察做出的教师绩效排序也是评估职前教师学习及专业发展的一种有效策略,但是不能用来在超出一到两个学期的学生教学中判断教师的学习与绩效。
在缅因及加州进行的教师教育项目中档案袋评估使用情况的研究中,利用教师候选人的自我反思及档案袋中的事例来推断教师在发展档案袋过程中学到了什么。由理查德与斯坦福教师教育项目中的教师候选人一起进行的一项早期研究中,考察了两种反思工具(档案袋与同学评议)对职前教师本性的影响。她发现档案袋有助于教师对课程内容的反思,同学评议则帮助教师对教学策略的反思。尽管在这个案例中,档案袋并没用作评估,理查德的研究表明,职前教师项目中档案袋不仅可以用作潜在的学习工具,同时还能发展成为具备反思性的材料。
第二个教学项目来自南缅因州立大学,自1994年大学开始使用档案袋评估,要求教师候选人在面试中呈现对自己有利的证据,作为学校及大学教师讨论会上有关认证结论的判断基础。在教师候选人的反思与档案袋中搜集的证据基础上,Lyons发现,在档案袋建立过程中,实习教师养成了一种思维习惯,帮助他们界定什么是好的实践活动,对自身教学和学习进行反思,同时帮助他们的学生进行反思。在对南缅因州立大学长达3年的教师教育扩大项目的研究中,包括了即将参加项目的本科毕业生、一年制的本科后职前教师项目、强化实习生、以及研究生第一或第二年的教学项目,通过档案袋分析的个案研究与开放性访谈,Lyons考察了学生对档案袋评估的理解,对资料的纵向及横向分析得出了几个主要观点:(1)最初的反思十分简单,一段时间之后内容开始详细;(2)质疑档案袋条目的批判性对话为培养教师对自我实践的认识意识提供了一个支架;(3)教学实践中有意义的部分如教学哲学得到发展;(4)有时看似痛苦的公开协作调查过程促进了教师对自身的了解以及对教学及学习价值的认识。尽管这项研究依据的是教师档案袋条目与访谈,它的长期设计强化了教师自我陈述的价值,为追踪教师对教学实践及教学哲学观点变化的路径提供了可能。
另一项研究考察了圣巴巴拉加州大学15年的本科后教师教育项目,同样对使用绩效评估来帮助新教师并促进其发展与作为问责意义下的评估工具之间的紧张关系进行了探讨。圣巴巴拉加州大学要求所有教师候选人建立一个档案袋记录达到加州教师认证标准的成功经历(“认证档案袋”),同时对于攻读教育硕士的教师候选人还有另外一个档案袋(“教育硕士档案袋”),这是用来解除对教师候选人的外部强制标准,鼓励对个人实践的反省,其重心在于帮助候选人培养“从教学中学习”的能力。在这项研究中,对两组学生教师(18位教师候选人)进行了两年的跟踪调查,从其职业准备的第一年到教学第一年。资料搜集来源为小组访谈、三种方式的认证档案袋会议及教育硕士帮助小组会议的录音记录、来自项目教师及学校参与职前教师帮助及指导的有关人员的反馈意见以及档案袋内容展示,包括教师候选人对自身作为教师的成长与发展所做的书面回顾。通过进行恒量比较及差异分析,研究发现尽管两种档案袋性质上有所不同,教育硕士档案袋开始便带着个人问题,认证档案袋开始便是州的标准,无论总结性还是形成性档案袋都引发了学生教师的思考。但仅一个档案袋既用作总结性又具有形成性目的,教师能否得到同样的学习收益并不清楚。同样模糊的还有,假如职前教师没有机会建立一个教育硕士档案袋,他们能否从认证档案袋建立的过程中学到同样多的东西。这项研究的一大优势在于对教师离开项目后一年仍进行了追踪调查,因为一些教师选择延迟结束其教育硕士档案袋直到他们具有全职课堂教学经验。但是,无论其档案袋建立之前或之后,都没有观察过这些教师教学实践情况,也就无法确证教师性向或实践的变化。
加州州立大学职前教师教育项目中档案袋的使用情况也进行了研究。Fresno(1998)考察了两组职前教师对档案袋评估试验的不同反应。一组是以学校为基础的项目(A组),在九月实习教学之初就引进了档案袋评估,第二组是在普通教师教育项目中任意挑选出来的60名“主流”学生(B组),在2月开始的最后一个实习学期引进了档案袋评估。这项研究的目的是检查处于不同档案袋准备及建构水平的两组职前教师,建立档案袋对学生学习及反思的影响。根据5月学生教学实习结束时填写的问卷,研究发现A组教师完成档案袋情况优于B组(分别为100%和20%),同时A组认为档案袋可以作为一项有效的教学反思及学习工具达到75%,而B组只有68%。对问卷及访谈资料的分析表明,职前教师遇到的主要问题为缺乏时间、困惑或过程理解局限、缺乏监督者或“主导”教师的帮助、搜集及选择事例难度以及总结写作问题。这项研究为考察不同条件下档案袋对职前教师学习的影响提供了一定可能。然而,尤其这两组学生教师在一些方面的情况并不一致,如(1)样本(对A组中的学生教师是否任意挑选没有做出说明)(2)职前项目经验,很难判断学生教师档案袋建立中的区别是因为处于不同条件还是由于两个职前项目本身学习内容不同引起的。
绩效评估对职前教师影响的研究得出的一个相同观点是,思考过程中的导师和指导对职前教师通过评估获得完全收益是非常关键的。这个发现表明,由于事先预设了一个促进思考的帮助环境的存在,绩效评估对学生教学定位、职前项目以及首次教学任务中的情境与新教师获得帮助水平十分关注。有必要对不同支持水平及学校教学环境对绩效评估影响教师学习方式的影响进行进一步研究。
总体而言,绩效评估对前教师学习影响研究的一个主要不足在于,没有充分考虑职前教师经验中的多种学习资源。因为职前教师在职业准备时间段有着很多不同的学习机会(大学课程、课程中的评估、专业学习或教学实习、监督教师及合作教师的建议、导师及同学指导)。
很难区分教师通过绩效评估获得的收益与其他学习资源中获得的进步。因此,这类研究很多都是依据教师自我陈述通过评估学到了什么。这种做法也是很有问题的,因为教师对于所学内容的判断带有内在的主观性。这提醒研究人员采取创新方法来区分新进教师从不同资源中获得的学习收获。
四、州教师执照中绩效评估执行情况。
对早期康涅狄格和加州新教师项目中引进绩效评估的研究中发现起初效果还是积极的。康州第一个要求在教师永久性执照申请中使用档案袋评估。然而,州对这些评估效果的评价是很有限的。尽管大部分康州发表的研究中有关于信度及偏见问题的研究,在一份研究中(Lomask, Seroussi and Budzinsky 1997)参加一项试验性质科学绩效评估的教师表示,教师大多认同档案袋建立过程以及参加项目帮助讨论会的经历对于教师专业发展与思维的发展是一个很好的机会。康州档案袋评估及其对新教师。指导教师以及评估主体的其他研究都在即将进行中。
过去几年,加州在其新实行的新教师征募项目中也进行了绩效评估实验(教师帮助及评估启动项目Beginning Teacher Support and Assessment)。由于各地BTSA项目都授权给了当地的教育机构,并通过一定竞争获得资助,全州范围内执行绩效评估的质量和内容缺乏一致性。
过去两年来,一些BTSA项目开始使用加州教师形成性评估及帮助体系(CFASST),这个体系最初是在1998-1999年投入试验用来帮助新教师的成长,另外一些BTSA项目发展了自己的绩效评估。一项研究特别考察了CFASST在全州7个不同地区的执行情况,发现参加CFASST的新教师会定期检查自己的教学实践。对大约40名教师进行了集中团体访谈作为案例研究,一些教师对CFASST的某些“强制性思考”做法提出了批评,比如要求他们对某些具体提示做出反馈,但绝大多数教师表示他们理解反思对于改善教学及学生学习的重大价值。研究同样指出,当教师参与一种围绕着质疑与反思的结构性帮助项目,其反思性思维的本质及范围更多集中在课程、教法及评估的一些具体要素之上。
然而,近来的一些报告显示,一些新教师对评估产生反感情绪,认为太过规范性(Moir 2002)。很多新教师将CFASST看作是另一种折磨人的官僚性质的考试,而非从中得到专业发展的一种机会。这些批评引起了人们对于CFASST是否是一种“真实”评估的怀疑,指出在参与评估教师经验塑造方面,以及判断评估究竟是一种学习机会或者是对教师“最好一面”之总结性评价,教师绩效评估形式与内容都是非常重要的因素。作为对这些批评的回应,加州圣克鲁滋大学(UCSC)新教师中心发展了自己的一整套绩效评估工具(形成性评估体系Formative Assessment System FAS),对每一位新教师进行绩效评估,指导专业发展及导师帮助。FAS结构支持专业目标设定,实践中的言行(听课、课堂录像、授课计划)基础之上的回顾反思、以及对学生功课的分析来决定学生成绩水平。
康州与加州州一级教师执照考核中绩效评估的运用及其开始的积极效果,还是很鼓舞人心的。然而,随着绩效评估在新教师中运用,他们在康州及加州征募项目中的使用又提出了同样的问题,在新教师最开始几年的教学中,如何区分从绩效评估中得到的收益与其他学习资源中获得的进步,诸如导师及同学帮助、征募项目讨论班和会议、学区及校一级的专业发展、内部及外部的专业网络、监督以及本人教学中的经验等。
研究中还有一个领域目前涉足很少,那就是绩效评估对教师专业学习的影响是否不同于其他水平的培养。在加州,由于紧急情况获得资格证的教师不符合BTSA项目资格,这些教师同样也不要求完成CFASST评估。如果绩效评估(如康州的档案袋评估或ETS为加州新教师设计的新型档案袋评估)用以州教师资格申请的理由为,绩效评估提供了一种更为精确及真实教师能力衡量方式,同时促进了教师的专业学习,同样重要的是了解这样的评估对帮助非传统途径进入教师行业的新教师专业学习是否是一种合适的工具。
由于很多教师在评估过程中中途放弃,要分析教师在一定时间内自我排序的变化情况,档案袋之前和之后的调查数据并不充分。因此,教师只在档案袋之后的调查中对自身教学技能进行了排序,而将教师评估之前和之后的感受进行了比较。
一项教师教育项目的调查研究发现,有24个项目中在6个月到17年不等的时间里使用了档案袋,平均时间长度为4.75年。96%的项目表示使用档案袋的目的在于促进学生的学习与发展,92%的项目鼓励学生自我评估和反省。
有话要说...