热门帖子

2015年9月18日星期五

当今大马:一位考生哭着出来?--对考题太难的批判应谨慎

一位考生哭着出来?

对考题太难的批判应谨慎


刊登于《当今大马》 https://www.malaysiakini.com/columns/312706#ixzz3m9q2aA00


黄集初     发表于 2015年9月18日 中午11点58分     更新于 2015年9月18日 下午2点30分

【时政】天下未集
一个有10万华小考生参与的考试,却有一位学生哭着出来,然后报界在1295所的华小中,访问几位校长、老师、两个博士,加上一个部长的投书,大家就一窩蜂说考题好难,甚至还进一步地“脑补”出一个结论:出题老师背后有阴谋,真是令人啼笑皆非。
当年在某独中教书时,记得有一次入学考后,某位家长到校大声投诉数学考题出得太难,害他孩子考得不及格,而他的孩子可是在UPSR校內预试中拿A等成绩云云。于是,教务处就赶快检查分数的分布情况,结果一堆学生考80分以上;再转为图表,呈现一个标准的常态分配曲线,这意味着考卷完全没问题。我和几位同事对此事商讨后的结论,就是这个UPSR根本就是自欺欺人的考试。
检定考试绩效只升不降
其实,在上世纪90年代之前,小学检定考试是很有水准的公共考试,那时不要说考获A等成绩,就算是考个B等,也算是很了不起的成绩,哪像现在,一堆学生考到全A的成绩。不过,自从现任首相纳吉担任教育部长起,整个风气就逐步改变了。纳吉在治理政务上一个特点就是非常注重数字管理:关键绩效指标(KPI)。所以,从他上任开始,每年小学检定考试的及格率就是一路上升,从没有下降过,完全违反考试学的规律。
但这种“政绩”却造成接下来的每一任教育部长很大的压力,也只能依样画箶芦,让小学检定考试的及格率只升不降,造成一堆学校都是百分百及格率。升到不能再升了,就开始比得A率的“政绩”,结果流风所及,就造成现在一堆考生考到全A的成绩。这本来就是不正常的现象,但二十几年下来,积非成是,变成如果考试不能让学生轻易考到A,就是出题老师有问题。而且也造成整个社会过于注重考试的风气,进而影响到学校不能正常教学,老师只能填鸭,学生就是背书。
但一个公共考试成绩不能如实地反映出国家整体的教育素质,始终是一个大问题,考试局肯定了解这个问题的严重性。所以,在2007年5月9日,报章报导:“考试局主张采国家教育评估制,建议取消UPSR及PMR”。当时的报章也报导,教总主席王超群也赞成“大马考试局提出2012年后取消小学检定考试及2015年后取消大马初中评估考试的建议,以纠正现有过于注重政府考试的教育机制”。
到了2010年6月20日,副首相兼教育部长慕尤丁向媒体发表谈话,表示教育部可能在未来会废除小六检定考试(UPSR)及初中评估考试(PMR)。此一宣示,在社会各阶层引起巨大的回响,赞同者有之,反对者更多。慕尤丁提出的理由是:“废除小六检定考试及初中评估考试除了能提升学生的思考及创意思维,也有助于协助政府削减开支、减轻教师负担、减轻家长压力及经济负担”。的确,废除UPSR及PMR确实是让大家都能脫离困境的一个好方法。
但到最后,只废除了PMR,UPSR还是保留下来,除了家长反对外,还有一个深层的原因,就是UPSR所衍生出来的共生利益太庞大了。在2010年7月8日,《光华日报》电子报有一则新闻“UPSR、PMR若废除,补习印刷业损失最大”,其內文提到:“倘若政府废除小六评估考试(UPSR)与初中评估考试(PMR)考试制度,这将直接造成补习行业严重受创,这也令参考书印刷商面临估计百万令吉的损失……间接地会砸破大多数教师的‘饭碗’,尤其是多数教师为提供学生补习,都靠此补习赚取额外收入补贴开销。”
因此,业者也希望:“有鉴于此,从事教育工作者敦促各方面能够出席教育部的圆桌会议,深入了解及研究各项事宜,方才决定”。报导中还提供了一项数据:“慕尤丁表示,共有20万2327名学生在国內2487补习中心报读小六评估考试、初中评估考试、大马教育文凭(SPM)以及大马高级教育文凭(STPM)的补习班”。这就是UPSR不能废除的根本原因。
争议各方背后的利益诉求
同样的,在今天讨论考题是否是太难时,也要把补习中心及出版社的利益冲突考虑进来。因为,如果考题没有标准答案,而完全是凭学生的真实能力时,补习中心若只是教考试技巧,那就准备关门;出版社的模拟试卷及各种各样参考书的市场肯定也会受影响;有些小学校长的隐性收入大概也会跟着减少。这种各方相关利益者的利益及立场,完全被现在各种评论所忽略了,一概假设他们都是“为了孩子好”,而不是为了錢包、面子、选票。
以下花点时间讨论下“相关利益者”,会有助于各位读者思考问题。相关利益者可分为:(1)內部相关利益者:学校管理者、当前的教职员工、家长及学生;(2)外部相关利益者:以往的教职员工、家长及学生;还有未来的教职员工、家长及学生;官方教育机构、私营教育机构、私营教育服务机构、当地社区、教育研究者、大众传播媒介等等。以下列一张表供大家去加加减减各別相关利益者的言论是否可靠。








下来針对上表中的三个相关利益者稍为做解说,其他就以此类推。(1)对学生及家长来说,当考题出得很难,连博士都做錯,而孩子却又能做对,家长一定支持,因为这证明了我的孩子确实是有出众的竞争力;反之,家长一定反对,因为他不能接受孩子原来是没有这么好。前者会暗爽不出声,后者一定会大声投诉是考题出的太难,难到连博士都不会做。(2) 对学校管理者和教师来说,固然有些是为了理想而投入教职,但更多的是希望有一个稳定的工作环境。所以,他们都不希望考试有任何重大的改变,因为,这意味着要改变过去已经习惯了的教学法。新老师还好,因为正处于摸索期;而旧老师则要看是否有“活到老、学到老”的精神及习惯,否则很容易僵化,要调整过来就会很辛苦。(3) 对大众传播媒介来说,考题难不难不是他们真正关心的议题,是否有新闻炒作的空间才是他们的焦点。所以,几万个考生没哭,那不是新闻;有一个考生哭,那才是新闻。找两个博士来做试卷,看起来很专业的样子,其实根本就是外行(下面会解说为什么是外行的做法),纯属新闻炒作,提高报章銷量。
考题是否真的太难?
那考题是否太难呢?基本上,批评者认为太难的依据有二个:(1)专家的意见;(2) 中国的水平。以下針对这两点做评析。
1.专家的意见。所谓术有专攻,一个专家必然有其特定的领域,在这个领域以內是专家,在领域之外,就不是专家。我们不可能拿法律问题去请教医生,或医学问题去请教律师;就算是接近的领域,一个心脏有问题的病人也不会求诊于肠胃科医生,这些都是常识。今天,找了一个社会学博士和一个中文系博士来测试试卷是否太难,根本就是风马牛不相及。一方面专业领域不对口,另一方面就是方法根本不通,让教育学专家傻眼。
今天,在华社里最有资格及权威评论这个试卷难度问题的专家是杨泉博士,他不但是教育学的专家,更是考试学的专家。他在教育部工作过,也曾担任董教总独中工委会的统一考试委员会主任委员。杨泉博士在华教界也算是知名人士,报界不第一个去访问他,反而去访问那些不是教育相关领域的专家,简直是令人想不通,新进记者就算了,资深的编辑难道不晓得吗!
2.中国的水平。首先,用语习惯和水平是两码子事,如狮子舞和舞狮,不可能用“狮子舞”就代表水平高,用“舞狮”就水平低。其次,为什么不能以中国的水平来考学生呢?这完全是心态的问题。看新加坡就好了,华文名义上是官方语文之一,其实是没有什么地位,所以,水平越来越低;反观英文,水平可以和英美比美,也没有人说太难,反而赞许这是正确的做法。
一个号称代表华人的马华部长,竟然认为华小华文科试卷与中国汉语水平并驾齐驱是不应该的,这是什么心态?说是崇洋媚外也不为过。三则,那我们的用语习惯是否要跟随中国的语文标准呢?这才是值得讨论的正确问题。在之前邱克威与杨欣儒的论战就是争这个问题,我不是这方面的专家,就让这个领域的专家学者去发言好了,但这个问题跟考题难不难是两回事。
那考题难不难如何判定?我这里就引用一位行家的说法,董教总独中工委会课程局华文学科编辑苏燕卿老师说:“其实考题到底难不难,不是凭老师家长路人甲乙丙的感觉,而是要看考生作答的实况。真正科学的方法,是统计全国考生的成绩分布,再分析试题的难易度。”
考题难易度该如何鉴别?
考题的难易度是有一个客观的标准,专有名词为:“难度”(符号为P)。其定义为:P = 1 – X/W(X为平均得分,W为这一考题的满分),最小值为0,最大值为1。值小表示容易,值大表示困难。在实务上,这些工作是要靠电脑来运算。具体来说就是考生的客观题的作答卡,及主观题的计分卡,用专门的读卡机把数据输入资料库里,然后,经电脑运算后,就可以得到学生的分数及整个试卷的分析报告。其中,最花时间是在主观题的计分卡上,因为要等评阅老师打分后,再把分数填入计分卡中。所以,在这份试卷分析报告没有出来或公布之前,所有考题难不难的争论是没有任何太大的意义。而照惯例,教育部考试局从来不公布这样的报告。
有某机构宣称会針对考题太难的课题呈一份分析报告给教育部云云,我认为如果这些民间人士手上没有这一份考试局的试卷分析报告的数据做依据,那凭什么写一份专业的分析报告给教育部?我们教育部对华社是不友善,但这不代表教育部官员都是没水准的一群人。
回到文章开头提到的“UPSR是自欺欺人的考试”的问题。我们现在的教育大问题是教育素质低落,差国际水平两个等级以上,而其中的一个重要因素就是公共考试鉴別力太低。有关这方面的详细讨论请参阅我另一篇文章:《教育大蓝图》之教育素质严重低落
考题的鉴別力又叫“区分度”,区分度和难度是息息相关。所谓区分度是指一道考题在多大程度上,能把不同水平的人区分开来。区分度越高,越能把不同水平的受测者区分开来。考题如太容易,所有考生都能答对,那这个考题区分度就太低了,因为不能把程度好及程度弱的考生区分开来;反之,如考题太艰难,所有考生都答錯,也同样是区分度太低。所以,区分度高的考题通常是难度适中的考题。总体而言,区分度高的试卷,会让能力高的考生得分高,能力低的考生得分低。
今天,我们的问题不是试卷太难,而是太容易,以致一堆考生拿到A等成绩,不能真正区分出不同水平程度的学生。面对灌水这么严重的公共考试,解决办法只有两种:1.废除;2.走向正轨。我的主张是废除,一了百了。不过,由于这背后牽涉的利益太庞大了,很难废除,那就让这个考试走向正轨,逐步提高试卷的难度到一个公共考试应有的水平。今天,负责华文试卷的官员提升试卷的难度,提高试卷的区分度,在具体的细节上,或有可议之处,但总体的改革方向应该受到肯定,而不是不懂装懂,胡乱批评一通,打击教育改革者的士气,否定他们改善我国教育素质落后国际水平一大截的努力。
有身份、有地位、有影响力的批评者,豈能不慎乎!


Read more: https://www.malaysiakini.com/columns/312706#ixzz3m9qUqwt0

没有评论:

发表评论

注意:只有此博客的成员才能发布评论。