语用测试之听写及TEM4考试
2009-04-06 英语口语 来源:互联网 作者: ℃(3) 有的人没听懂,自然也就写不出,或写的时候非常粗心,笔误太多。
同样类型的错误,也有可能反映出不同的语言能力。 比如, 同样是漏字, 有的是漏掉无关全文理解的结构词, 有的是漏掉重点信息的关键词(key word), 同样是拼错词, 有的是跟本写不出, 有的是错掉一个字母, 跟据1994年的评分标准, 每两个标点符号错误扣一分,两个拼写错误扣一分,即纯粹的以形式的准确性作为唯一的评分根据, 而忽略了听力理解(comprehension)的能力, 交际的意义性。这样做的结果便是使处于第二种和第三种情况的考生有得分相近的可能, 也就是说,听懂了部分或写出了部分的人(但有笔误)和一些完全听不懂,不知所云的考生从最终成绩上看不出卷面上的差距。 另一种情况是有的人由于某种原因, 前面或后面的几个句子漏写了,根据个数统计, 也许会扣掉大部分或几乎全部的分数,即使他写出了其他的句子。 这几种情况大大地影响了评分的信度,考试的区分度,从而不能真正的衡量出学生的实际语言水平, 失去了考试的意义。
94年之后, 这问题便直接(从评分员)或间接地(稍后作的Questionnaire)提了出来。 通过综合考虑各种意见, 大量的试验之后, 重新修订了评分标准。 即从语言知识的准确性(accuracy)和交际意义的流畅性(fluency)两方面, 根据所犯错误的大(如key words的遗漏, 重要词的严重拼误, 对情态助动词的遗漏, 介词, 关系代词的错误严重影响了语群的意义, 时态和语态的错误, 及句群的结构部分错误却影响了整个句群的内容, 小(如标点符号,大小写, 定贯词, 指示代词,范连接词, 名词的单复数, 主谓不一致, 动词不定式符号to的省略, 不严重的拼写错误或省略等)对交际内容的正确传达的影响大小等, 来确定不同的扣分标准。 同时每个chunk最多只能扣一分,这样由于对于某句话(chunk)的不理解而导致的错误输入不会影响到对另一句话(chunk)正确输出的得分。 同时, 形式(form)的准确性兼顾交际意义(meaning)的流畅性体现了教学大纲中"对学生实际运用语言的准确性和流利程度必须并重"的原则, 从另一方面也可以促进交际教学法的应用。
实践证明, 新的分层次
的评分标准更灵活, 对于提高听写评分的信度和区分度及评分的效率都大有好处, 大多数评分员也都认为更合理。
然而, 根据错误的性质制定的评分标准仍有待于完善, 因为目前还缺乏对听写中各语言能力分配的科学证明, 在对于错误性质的认识上, 有时也会产生异议: 如有的错是算语法错(大错)还是无伤大雅的小错; 单词的拼写中几个字母错算拼错; 标点符号的错而影响到后一句的大小写, 算一个错还是两个错等, 有的人会从严格的一面评分, 而有的评分员比较宽容, 这势必会影响到评分的可靠性和稳定性。
在总的评分原则指导下,每次通过预测都要有针对性地找出(identify)具体的典型错例,在每次评分的当天上午让每个有关阅卷人熟悉掌握, 修改补充, 然后才能正式使用。评分标准比较详细的规定了可能出现的错误, 掌握并熟练运用需一定的时间和实践因而, 对评分员的要求较高。
VI. 提高听写的效度和信度, 促进英语教学
1 效度上:
虽然在大规模的全国性考试中采用听写, 工作量太大, 标准也不易统一, 但从实际考试分析上可以看出这种测试法有利于提高试卷效度; 在笔者所做的一次问卷调查中,许多从事高校英语教学的老师都承认自己或多或少曾经受到过听写训练, 并在教学中定期采用, 有助于提高听力, 拼写, 篇章理解力, 反映速度, 记忆力, 克服母语干扰, 尽管如此, 听写目前仍属于感性教学, 没有一套完整的理论编排体系, 因此, 从长远来看, 如何促进听写教学向理性发展, 确定听写考试的构成效度(construct validity), 更体现内容效度(content validity)中语言要素的运用和技能发挥,即其内容要选取典型的语言要素和相关技能,各种语言要素的合理分配; 评分标准中对各种性质的错误得分比重的合理性, 仍需大量的实践和理论研究;
2 信度上
听写的评分是评分员根据评分标准(Marking Scheme)阅卷,因此象写作一样,在评分时对评分标准掌握的松紧程度不一,多少带有主观性考试。 为提高信度, 需要:通过培养相对稳定的熟练掌握 Marking Scheme 的阅卷员队伍来改进;制定一份更客观、全面、科学,易于操作的 Marking Scheme。 目前TEM4中听写所采用的分析法评估, 一个很明显的缺点是速度过慢,费时费工。 就本人参加的94,95,96三年的阅卷工作而言,每次评分中听写的评分员占了全部的一半或更多,且阅完卷后大都会疲惫不勘,甚觉乏味。 因此, 从长远来看,如何制定一个更简便经济的评分标准, 向holistic scoring 接近, 仍是尚须解决的一个重要方面,否则, 随着参考人数的增加, 阅卷工作量的增大, 对评分人员的需求量上升, 也会从另一方面降低考试评分的可靠性(reliability)。
3 教学中:
重视这个古老而有效的教学和测试手段;跟据教学大纲, "掌握语言知识和发展语言能力是互相促进相辅相成的", 因此在教学中要"设计某些以完成任务为目的的语言活动, 以巩固语言知识, 发展运用知识的熟巧, 促使语言能力向交际能力转化", 然而交际能力的发展往往不是同语言能力同步增长, 需要"有计划的培养和反复实践才能获得",笔者认为, 有计划有步骤地选择设计些恰当的听写材料可以为此转化提供较理想的契机, 这是由听写的性质与听写练习的简单易用, 适合课堂或个人操练而决定的。
有教学必然就要有测试,两者不可或分。教学通过测试了解学生的学习情况, 问题的症结,检查教学的结果, 反之,测试可以影响和促进教学的改进。 通过TEM4, 使人们基本了解了各校对教学大纲的执行情况, 而本文对其中听写的不太成熟的分析, 则希望能为学校中的课程设置和英语教学提供一些有益的反馈信息 (positive feelback)。 然而由于听写的心理过程的复杂性,涉及听写的理论不是很多, 因此如何更好地制定听写考试及评分标准, 如何对于这一不可或缺的技能提高教,促进学的质量, 如何更好地科学客观地测试, 仍然需要更进一步地探索。
┨网页设计特效库┠ http://www。z┗co⊙l。com/网页特效/
- 相关阅读
- 参加考试04/23
- TOEFL考试作文经典妙语04/23
- 常见的英语用as...as表示的明喻形式04/23
- 纺织品测试相关英语04/22
- 会计账目英语用语04/22
- 支票英语用语04/22
- 大学英语四、六级考试如何报名04/22
- 【简明语法】15.1 并列结构作主语时谓语用复数04/22
- 英语测试:你的词汇量如何该如何背单词~04/22
- 并列结构作主语时谓语用复数04/22
