近日,香港科技大学张军教授、孟子立教授团队进行的一场实验引发广泛关注。实验中,一款搭载ChatGPT-5.2模型的乐奇Rokid AI眼镜,在《计算机网络原理》课程的期末考试中,仅用30分钟完成答题并取得92.5分的成绩,表现优于95%的人类考生。

该实验严格模拟真实考试环境,硬件选用开发自由度较高的乐奇Rokid AI眼镜,软件则搭载了在响应速度和知识储备方面表现卓越的ChatGPT-5.2模型。在考试过程中,AI眼镜通过内置摄像头拍摄试题并传输至大模型,后者在0.8秒内完成推理并生成答案,随后答案回显至镜片供使用者抄录。

实验结果令人瞩目:AI在选择题和单页短答题部分获得满分,面对跨页逻辑题时虽存在细微计算偏差,但其推理的连贯性与步骤的完整性远超大多数学生。此前,英国雷丁大学的研究也得出类似结论:94%由AI生成的答卷可通过人工审核,且平均成绩高于真实学生。
这项实验揭示了一个核心矛盾:传统笔试侧重于考察知识点的记忆和标准解题步骤,而这恰恰是人工智能的优势领域。当机器在“提供标准答案”方面超越人类时,传统考试的评估价值便受到显著削弱。

面对这一冲击,高等教育机构已开始探索改革路径。例如,纽约大学推出了AI口试系统,通过追问学生的推演思路来评估其真实理解程度;部分院校则引入展示型作业与现场答辩,要求学生阐释其决策依据;还有机构采用“过程性档案袋”的方式,记录学生从提问到解题的完整思维轨迹,从而将评估重点从“结果”转向“思考过程”。
同款不同命!iPhone17马年壳官方499元仿品却要10元