预览加载中,请您耐心等待几秒...
1/4
2/4
3/4
4/4

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

大学英语口语测试研究综述摘要:本文回顾了中国近13年来关于大学英语口语测试的研究通过数据分析归类了发表外语类核心期刊上有关口语测试的论文。就研究内容而言这些论文主要涉及口语测试任务的效度、口语测试评分信度以及非面试型口语考试。笔者通过对这些论文的综述展示了我国口语测试的发展现状及现存的问题希望为大学英语口语测试的发展和完善提供借鉴。关键词:口语测试大学英语研究综述口语测试是交际能力测试中不可或缺的一部分。本文中笔者通过中国知网的检索发现2000-2012年间与“口语测试”相关的学术论文共计1732篇其中发表在外语类核心期刊上的文章共计42篇。具体检索结果如表1和表2。本文只综述了发表在外语类核心期刊上的42篇文章从口语测试评分信度、口语测试任务的效度以及非面试型口语考试这三方面进行分析论述。(见表1和表2)一、口语测试评分信度研究目前我国现行口语测试的评分方法主要有三种:能力分项评分法、题型分项评分法和整体评分法。国内学者对评分方法的研究主要涉及:对现行口试评分方法的对比和完善对新的口试评分方法的探索主要涉及模糊评分方法和机器阅卷。吕长的研究表明这三种评分方法从实质来看基本一致。分项评分法适合经过严格培训的授权考官而整体综合评分法适合仅仅接受过初步培训的未授权考官因此应用性更广泛。熊敦礼通过实验对比了两种评分方法与四级成绩的相关性发现综合评分法所得的分数与四级考试分数的相关性最大。易千红首先引入了评分模板的概念以统计理论为基础最终将学生口语水平的排序换算为分数。张文忠和金檀等分别从理论和实证的角度对模糊评分方法进行了深入研究证明模糊评估比现行评分方法更客观准确。李萌涛等对机器阅卷系统进行了探索通过实验得出机器阅卷和人工阅卷的相关系数为0.713说明机器阅卷有较高的评分信度。机器阅卷只要将录音材料输入阅卷系统计算机程序就会自动阅卷平均每1.5分钟可以处理一份录音数据具有的经济性、方便性、快捷性等特征。二、口语测试任务的效度研究根据口试任务对口语能力的不同测试重点口试任务可以分为三类:第一类主要测试语音语调如复述;第二类主要测试连贯表达能力如观点陈述;第三类主要测试言语交际能力如小组讨论等。吕长通过实证研究表明从结构效度来看这三类口试任务的内部相关系数在0.886以上呈高度相关。郭丽等的问卷调查显示:简短发言难度最大考试时最紧张;角色扮演最受欢迎。金艳研究表明就某一话题发表意见和看法是考生最喜欢的题型。综上所述交际类口试题型是由于其交际性强、记忆负担较轻、信息加工要求较低等特点而深受广大考生欢迎。三、非面试型口语考试熊敦礼对录音口试进行了考生设计、考试程序、考官培训等方面的实践探索证明了大规模录音口试的可行性。蔡基刚设计实验对比了计算机口语考试和面试型口语考试得出考生在两种考试中成绩相关系数为0.7058。金艳等对75名学生进行面试考和机考的对比测试实验结果证明两种考试所得的成绩相关系数为0.700与蔡基刚的实验结果基本一致。熊敦礼认为机考可以利用网络资源和计算机本身的优势在考试中增加视频及音频材料使题型更加多样化因此比面试考试具有更高的内容效度;金艳等则从实证的角度通过分析考生在考试中所运用的语言功能来对比两种考试的内容效度研究还涉及了对考生语言特征和词汇密度方面的分析。经对比发现两种考试所反映的考生的语言质量基本相同。本文综述了2000-2012年间发表在外语类核心期刊上有关口语测试的论文。对于现行的评分方法而言整体综合评分方法最受欢迎应用最广泛;同时模糊评分方法以及机器阅卷越来越受到语言测试专家和学者的关注。就口语测试任务的效度而言交际类口试题型是交际性较强记忆负担较轻信息加工要求较低将成为未来口语测试的主要题型。就测试方式而言非面试型口语考试相对于面试口语考试而言节省了大量人力物力财力但是交际性和真实性较差需要在实践中不断完善和发展。参考文献:[1]蔡基刚.大学英语四、六级计算机口语测试效度、信度和可操作性研究.外语界2005(4).[2]熊敦礼等.大学英语大规模录音口语测试研究.外语教学与研究2002(4).[3]李萌涛.大规模大学英语口语测试朗读题型机器阅卷可行性研究与实践.外语界2008(4).[4]吕长.口语测试评分标准比较研究.外语教学与研究2008(6).[5]金檀等.口语测试模糊评分方法设计及实验研究.现代外语2008(2).(责编张亚欣)