魅优论文范文网

 找回密码
 立即注册
查看: 11233|回复: 0
打印 上一主题 下一主题

[语言文学] 关于词汇检测效度的不足与对策

[复制链接]

5154

主题

5155

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
15566
跳转到指定楼层
楼主
发表于 2014-3-2 12:25:11 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
  论文关键词:词汇测试 测试手段 测试的目的、效度和信度

  论文摘要:大学词汇测试主要是考察学生对词汇的含义和词形的掌握情况。但是词汇测试不仅仅需要考察意义和词形这两方面,而要旨在考察对词汇全方位知识的掌握(Nation,2001)。目前广泛应用的两种词汇检测方式来探论词汇测试中存在的不足,为了提高词汇测试的效度,需要考察被测试者更全面的词汇知识。

  引言

  20世纪词汇测试主要和客观性测试的发展有关。客观测试是指学习内容被分成一个个细小的单位,每个单位通过一道事先编好只有一个正确答案的题目来进行测试(Read,20oo)。最普遍的方式就是多项选择题,它的客观性就在于评分者不需要主管评判就可给出精确的评分。这种通过分离、无联系的题目(discretepoint)来测试词汇的方式早已被认为不是一个有效的方式。相反地,应该通过间接的综合测试(indi.erctintegrativetesting)来考察学习者利用所学知识应用词汇的能力。Read(20oo)试图解答关于词汇知识掌握的质量的两个问题:一是如何将“词汇知识”概念化?二是如何检测“词汇知识”。结果他发现“词汇知识”本身是一个非常复杂的概念,就具体目的要以和学习者访谈的方式进行评估。因此,要想明确如何进行测试、测试哪些方面,首先必须要清楚词汇到底有哪些方面可以被测试或者需要测试。Nation(2001)提出了关于词汇知识的三个方面:词形、词义及词的应用。每个方面分别又涉及到三个方面。Nation指出要想达到英语为本族语的人的熟练程度,这九个方面是外语学习者应该掌握的。

  词形:1)口语形式;2)书面形式;3)词的构成部分词义:1)形式与意义;2)概念与所指;3)联想(联系)应用:1)语法功能;2)搭配;3)应用的限制(如语域、频度等)Nation对于每个方面又进行了接受性知识(RK:erceptiveknowledge)和产出性知识(PK:productiveknow1.edge)的划分。RK主要指在听或读时对词形的辨认和词义的回忆,PK主要指在说或写时表达或写出恰当的词性及词意。比如,就“形式与意义”这方面的RK可能是“这个词所传递的意思是什么”而PK可能是“哪个词可以用来表达这个意思”。

  两个测试方法

  多项选择题和词形转换填空题一直是英语词汇测试的两个普遍的、重要的检测手段。

  (一)多项选择题

  多项选择题一般又分为两类:匹配题和填空题。

  1.匹配题。即给出一个句子,其中某个词下画线(或斜体),要求考生在四个选项中找出一个与下画线(或斜体)的词意思相同或相似的词。如:

  They occasionally stop by to see us.

  A.often B.usually

  C.seldom D.onceinawhile

  总的说来,这种模式主要是考察“接受性”知识。考生需要识别出画线词的词形及意思,选择一个具有相似意思的词。它无法通过考生的回答来判断其运用该词的“产出性”能力。但是,通常试题会给出考生一定的语境(context)以便考生能通过一些线索clues)来做出判断。Nation(2001)根据语境的多少和范围将语境分为三种:1)孤立的词(isolatedwords);2)句子语境(其中又分为最小化句子minimalsentence和长句long sentence);3)篇章段落语境。现在我们所见到的试题绝大多数都属于第二种。

  2.填空题。通常是要求考生从给出的选项中选出一个可以填人到题目句子中的词。如:

  Vickiehad mostprobably---·—--her for another sort of girl

  A.regarded B.viewed

  C.im staken D.1ooked

  同匹配题类似,此类题型还是主要考察考生的接收性知识而不是产出性知识。它要求考生根据上下文判断出所要填人的词的可能的意思,然后从选项中找出一个适合于题目句子的词,主要是对词义及词形的考察。在上面的例子中,四个选项为同义词,考生需要在联系的基础上作出恰当的判断。此外,本题还考察了词的搭配关系,即目标词必须要与介词for来搭配。如果考生不能回忆起这一搭配,即使创建了联系也无法作出正确选择。

  (二)词形转换填空题

  简单地说此类题就是用给出词的正确形式填空。如:I’dliketogowihtyou,butiwht Somuchworktodohtis aftemo nrm——to.(able)

  与多项选择题不同,此类题主要考察了对派生词的产出性知识的掌握。如上面的例子,考生需要知道如何将able变为其反义词的形式。有些此类题还考察搭配知识,因为同词根的不同词性的词可以和不同的词搭配。所以,此类题主要考察书面形式的产出性知识,尽管考生能判断出用什么词性及意思的词,如果不知道添加什么样的前缀或后缀,仍然无济于事。

  综上所述,上面两个典型的词汇测试题型中多项选择题主要考察接受性知识,而词形转换填空题主要考察书面形式的产出性知识。涉及到检测的方面主要包括:意义(意思)、形式、词的构成、联系、搭配和语法功能等。值得注意的一点是,没有对口语形式和应用的限制这两方面进行任何考察。

  测试的目的、效度和信度

  BachmanandPalmer(1990)指出,设计测试的第一步就是要明确测试的用途。总的说来,语言测试的用途可分为三类:研究用途、对学习者做出判断或决定及对语言课程作出决策。作为教师,我们主要是通过测试的结果对学生作出判断或决定。ReadJ.(2001)指出,在这一用途上,教师应着重几点:评估阶段性学习效果或进步、评价语言水平、获得诊断性信息、将学生按水平或级别分类等。如就词汇测试而言,教师会通过测试来看学生是否会在新的语境或上下文中应用学过的词。上面谈到的两种手段基本达到了这一目的。

  效度是指一套测试所要考的是否就是设计人想要考的内容,或者说,在多大程度上测试了想要测试的内容。效度的高低是衡量测试最重要的指标,或者说是语言测试的基本出发点(刘润清,韩宝成,1991)。Hughes(1989)指出一个词汇测试的有用性不是显而易见的,这说明任何一个测试手段一定在某些方面存在效度上的不足。当然,设计一种能考察所有方面的测试方式是非常困难的,甚至是不可能的。这也就是为什么上面两种方式仍然被普遍应用的原因之一。根据Hughes(1989),同一套试题在不同的时间和条件下,考生得出的成绩越接近,测试的信度就越高。应该说词汇测试考察考生对词汇知识的掌握,它受时间与客观条件影响的程度相比其他技能(如)而言要低一些。但事实证明,即使同一道试题,考生可能在周一做出的答案与周三做出的答案不一致。当然其原因有很多。抛除考生方面的原因,另一个重要的原因就是试题所考察的方面很多,考生在不同的时间里会把注意力集中在不同的方面上。

  结论

  词汇学习本身不是目的,它的作用是使学习者更有效地提高听、说、读、写几方面的能力。在进行词汇测试时,区分开对词的了解程度(接受性知识掌握程度)与应用程度(产出性知识掌握程度)是非常重要的。当今的词汇测试手段更多的是考察考生对接受性知识的掌握,我们不能说它们有很大缺陷。但我们必须明确一点:词fl-N试在考察接受性知识的同时还要考察产出性知识,只有通过全方位的考察,才能检测出学习者对词汇全方位知识的掌握,从而达到更好的测试效度。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机访问本页请
扫描左边二维码
         本网站声明
本网站所有内容为网友上传,若存在版权问题或是相关责任请联系站长!
站长联系QQ:7123767   myubbs.com
         站长微信:7123767
请扫描右边二维码
www.myubbs.com

QQ|Archiver|手机版|小黑屋|魅优论文范文网 ( 琼ICP备10200388号-7 )

GMT+8, 2024-4-28 23:05 , Processed in 0.228457 second(s), 20 queries .

Powered by 高考信息网 X3.3

© 2001-2013 大学排名

快速回复 返回顶部 返回列表