高考数学中考试评价的研究

一、问题的提出

高考对试题命题和质量的评价至关重要。目前，试卷的制定和评价主要是基于经典测量理论(Classical Test Theory, CTT)和项目反应理论(Item Response Theory, IRT)。CTT利用桑代克(E.L. Thorndike)“凡物之存在必有其数量”和麦柯尔(W.A.McCall)“凡有数量的东西都可以被测量”作为理论依据①。根据学生的考试分数进行直接评价，也称为真分数理论。CTT理论试卷评价方法简单、运算方便，易于掌握，是我们目前广泛熟悉和应用的测量理论。它对试卷的评价主要是依靠试题的难度、区分度、效度和信度进行。除了难度是一个比例之外，其余三个指标都是依靠相关性概念来对试卷进行评价分析。CTT理论依靠样本，样本不同对同一份试题的评价也就会产生差别。IRT也称潜在特质理论，起源于20世纪三四十年代的心理测量研究。基于一定假设，用一个数学函数去刻画被试在项目上可观察的作答表现(得分)与其不可观察的特质水平(能力)之间的关系，利用这个函数关系，可以对被试在项目上的作答反应进行预测，同时也可以利用被试在项目上的作答反应对被试的能力进行估计。可以说，模型与假设是整个IRT的核心和基础。目前比较常用的数学模型是二参数逻辑斯蒂模型、三参数逻辑斯蒂模型、Rasch模型和等级评分模型②。

IRT已成为一种新的现代心理与教育测量理论，如SAT、PISA等考试，都是基于IRT的应用。我国现在大学英语四、六级考试也开始运用IRT进行等值研究③。王晓华④、沈南山⑤、赵守盈⑥等人分别就IRT在教育考试命题质量、学业测试、标准化考试等方面进行了研究。但是这些研究都还不涉及实际的普通高考。为此，

云奕文章网

高考数学中考试评价的研究

相关推荐：