2026年1月7日下午,香港科技大學(xué)計算機實驗室的監(jiān)控畫面記錄下震撼一幕:戴著樂奇Rokid AI眼鏡的孟子立教授僅用30分鐘就完成《計算機網(wǎng)絡(luò)原理》期末考試,系統(tǒng)自動批改顯示92.5分的成績瞬間躍上屏幕——這個分?jǐn)?shù)超過了同期95%的人類考生。這場由張軍教授團(tuán)隊主導(dǎo)的實驗,正在全球教育界掀起關(guān)于AI時代評估體系重構(gòu)的颶風(fēng)。
實驗采用的樂奇Rokid AI眼鏡搭載了ChatGPT-5.2定制模型,其硬件配置堪稱“作弊神器”:8000萬像素的微型攝像頭能以0.3秒/頁的速度捕捉試題,骨傳導(dǎo)耳機同步接收AI生成的語音提示,而最關(guān)鍵的AR投影模塊可將答案直接投射到視網(wǎng)膜成像區(qū)域。在模擬真實考場的環(huán)境中,系統(tǒng)處理一道選擇題的平均耗時僅0.8秒,即便是需要拓?fù)鋱D推導(dǎo)的復(fù)雜網(wǎng)絡(luò)協(xié)議題,AI也能在12秒內(nèi)完成從圖像識別到分步解答的全流程。

考卷分析報告顯示,AI在標(biāo)準(zhǔn)化題型上展現(xiàn)出碾壓性優(yōu)勢。對于“TCP三次握手過程”這類知識點記憶題,AI的作答與教科書完全一致;而在“計算子網(wǎng)掩碼”等流程化問題時,其推導(dǎo)步驟比85%的學(xué)生更規(guī)范。唯一失分點出現(xiàn)在開放性較強的案例分析題,AI將“區(qū)塊鏈應(yīng)用于校園網(wǎng)絡(luò)”的方案設(shè)計得過于理想化,未能考慮教務(wù)系統(tǒng)的實際兼容性問題——這個細(xì)微偏差恰恰暴露出當(dāng)前大模型在落地場景經(jīng)驗上的局限。
實驗數(shù)據(jù)與英國雷丁大學(xué)早前的研究形成殘酷對照:在匿名混入的1.2萬份AI生成答卷中,94%能騙過教授的人工批改,且平均分比人類學(xué)生高出6.8分。這種沖擊直接動搖了傳統(tǒng)考試的底層邏輯。“當(dāng)機器比人類更擅長‘應(yīng)試’,我們到底在考核什么?”教授在實驗報告中發(fā)問。紐約大學(xué)教育技術(shù)中心主任麗莎·陳的跟蹤研究印證了這一焦慮:在計算機、金融等標(biāo)準(zhǔn)化知識密集型領(lǐng)域,AI已能穩(wěn)定產(chǎn)出前10%水平的答案。
全球高校正展開應(yīng)對實驗。香港中文大學(xué)開發(fā)的“思維顯影”系統(tǒng)要求學(xué)生在每個解題步驟后錄制30秒的口頭解釋;麻省理工的“代碼演化樹”平臺則自動記錄編程作業(yè)中所有調(diào)試痕跡。更激進(jìn)的改革來自北歐,奧斯陸大學(xué)將40%的課程評估改為“對抗性測試”——學(xué)生需現(xiàn)場修改AI生成的錯誤答案并論證修正邏輯。這些探索都指向同一個方向:評估重心正從“答案正確性”向“思維可見度”遷徙。
![]()
在這場人機博弈中,教育者開始重新定義“核心素養(yǎng)”。上海交通大學(xué)試點的“過程性檔案袋”收錄了學(xué)生從文獻(xiàn)檢索到終稿的全周期數(shù)字足跡,其評估維度包括“提問質(zhì)量”“迭代次數(shù)”等17項元能力指標(biāo)。而東京工業(yè)大學(xué)開發(fā)的“AI協(xié)作指數(shù)”則量化計算人類在混合任務(wù)中的貢獻(xiàn)值,其校長松本淳一指出:“未來人才的優(yōu)勢不在于記憶或計算,而在于提出AI想不到的問題。”
商業(yè)領(lǐng)域已嗅到變革先機。硅谷初創(chuàng)公司EduMeta推出的“認(rèn)知增強監(jiān)考系統(tǒng)”,能通過眼動追蹤和壓力傳感器識別學(xué)生是自主思考還是依賴AI提示。國內(nèi)頭部在線教育平臺則紛紛上線“AI對抗訓(xùn)練營”,學(xué)員需要設(shè)計能難倒GPT-5的原創(chuàng)題目。這些嘗試暗合了教育家杜威百年前的預(yù)言:“真正的考試,應(yīng)該測量的是面對未知時的創(chuàng)造性混亂。”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.