NeurIPS 2023｜面向自适应测试(CAT)的子集选择方法

自适应测试 CAT 方案作为个性化教育中的重要组成部分，需要能以尽可能少的题目来精准估计学生能力，减轻学生负担。同时，CAT作为关乎学生前途命运的标准化考试方案，能力估计准确性的理论保证至关重要，是被学校师生认可和接受的关键因素，却被以往方法所忽视，这也是本文提出的BECAT方法尝试解决的问题。

论文题目：

A Bounded Ability Estimation for Computerized Adaptive Testing

论文链接：

https://openreview.net/pdf?id=tAwjG5bM7H

开源代码：

https://github.com/bigdata-ustc/EduCAT

一、背景介绍

如何能够高效地评估学生能力？ 一般地，我们会进行一场纸笔考试，千人一卷，即所有学生回答同一张试卷来评测他们的能力。然而，这会要求学生回答大量的题目，加重了学生的负担。

近年来，AI教育中的计算机自适应测试(CAT)受到广泛关注，它能够自动化地为每一位学生量身定制试卷，能尽可能推荐少量的题目准确地估计学生能力。最典型的应用就是我们比较熟悉的GRE考试。

解决方法:

验证能力估计值是否能够准确预测学生的作答行为（正确or错误），使用AUC和ACC作为评价指标。如下图，本文发现BECAT作为一个不需要训练的贪心算法，整体上超越了其他需要额外训练的数据驱动的方法（例如，BOBCAT，NCAT）。

Illustration From IconScout By Delesign Graphics

-The End-