![]()
2025年10月27日,哈佛大學本科生教育學院發布《哈佛本科學院學術重心回歸:評分與課業負擔改革》(Re-Centering Academics at Harvard College: Update on Grading and Workload)進展報告。[1]這份25頁的報告指出,哈佛評分體系已寬松到無法有效區分學生學業水平的地步,警告現行評分制度"未能履行成績評定的核心功能",正在"損害學院的學術文化"。
報告具體從現狀、原因、對策等方面進行了分析,概述如下:
一、現狀:評分失效與學術文化受損
報告指出,哈佛的成績在過去一直呈上升趨勢,而近年來這種上升已變得尤為顯著。其直接后果是評分尺度頂端出現嚴重壓縮。具體而言,2005年哈佛本科學院所有成績中A等級占比為24%,2015年升至40.3%,到2025年已達到60.2%。
![]()
報告提出,除非我們相信這60.2%的作業確實達到了卓越品質——即文理學院評分指南中對A的定義——否則就必須承認存在明顯的成績膨脹。
為深入了解現狀,本科生教育辦公室在夏季對師生進行了調研。結果顯示,幾乎所有教師都對評分表示嚴重關切,普遍認為所給分數與學生作業質量之間存在明顯錯位。新到任的教師對課程評分的寬松程度感到驚訝,而資深教師則對與過去幾年間的差異感觸頗深。相比之下,學生態度更為樂觀,但不少人也抱怨另一種不匹配,即他們認為不同專業、課程乃至同一課程的不同部分之間,存在顯著的評分差異。
就評分功能而言,報告發現現有體系已難以發揮應有作用。
——在激勵學習方面,教師察覺并學生也證實,在當前體系中,成績既是努力的推動力,也構成了努力的上限。學生通常只做獲得A所必需的事,很少被激勵去做更多。
——在信息反饋方面,教師指出當前分數區分度不足。一位教師直言,學生知道A等可以對應從出色到基本滿意的各種表現,這近乎一場鬧劇。另一位教師則更委婉地指出,評分在頂端已缺乏足夠的分辨力。
——在區分優秀方面,成績已無法有效識別最出色的學生作業。獎項委員會成員反映,很難憑幾乎相同的GPA區分學生,有時不得不借助保密推薦信來判斷。這種做法往好里說不夠透明,往壞里說可能引入偏見與不一致。
此外,當前評分實踐正對學院學術文化造成廣泛損害:
——限制了學生的選課自由。當A成為中位數成績時,4.0不再是少數人的目標,而是多數人竭力維持的底線。一名學生坦言他們對A-感到恐懼,這種心態直接影響其選課策略,使其傾向于選擇能給A的課程,而非真正有價值或感興趣的課程。
![]()
——加劇了學生的整體壓力。當A成為普遍現象時,僅獲得A已不足夠。為脫穎而出,部分學生被迫追求雙專業、碩士項目等額外學術資歷,或過度投入職業型社團,導致成就焦慮蔓延至課堂之外,滲透進大學生活的各個領域。
——掏空了學術的內涵。當A成為常態,學術體驗有時讓學生感到虛假。有學生反映從未有教師指出其可提升之處;也有學生認為期末考試在開學首日就能輕松應對。他們本以為是瑰寶的課程,結果卻如同贗品。
關于課業負擔,數據顯示學生投入的學習時間并未減少。2025年春季學生報告每門課每周課外學習6.30小時,高于2015年同期的5.55小時。然而,人文學科與解釋性社會科學的教師普遍反映,因學生閱讀復雜文本的經驗與持續專注能力下降,他們不得不削減閱讀材料,甚至以短篇替代長篇小說。
報告最終明確,學校總體上并無課業負擔問題,但評分問題確實存在且十分嚴重:評分過于壓縮和膨脹,同時缺乏一致性。更重要的是,它已無法履行核心功能,并正在侵蝕學院的學術使命。
二、成因:多重壓力下的系統性失衡
報告指出,教師抱怨哈佛的評分實踐已經失控,但許多人卻又感到無力改變。約半數的受訪教師表示,他們根本無法打出學生實際應得的成績,而其余教師則表示這樣做非常困難。
報告認為,評分之所以如此困難,主要源于四個方面的壓力。
一是教師同行的壓力。教師并非孤立地評分,他們深知自己的作業要求和評分標準會被拿來與其他教師進行比較,沒有人愿意成為異類。教師們也清楚他們彼此在爭奪學生。良好的選課人數能保障研究生的教學機會,為系所帶來更多師資編制的可能性,以及將學生引入其畢生所研究學科的機會。在這種背景下,教師為了提升選課人數而降低標準是合乎情理的。一位教師評論道,哈佛的評分正在陷入一場逐底競爭,這是一個經典的博弈論問題。而且這一問題在近年來隨著課程評估系統(Q評分)的變化而加劇。
二是學生的壓力。有時這種壓力是直接的,例如一些學生會質疑他們的成績,或者對每一項作業都采取一種日益好訟的態度。有時壓力則是間接的,一些導師會不恰當地為學生出面爭取。
三是學院本身的壓力。在過去大約十年里,學院一直敦促教師們牢記,有些學生進入大學時的準備不如其他同學,有些學生正在艱難應對困難的家庭狀況或其他挑戰,許多學生正在與冒名頂替綜合癥作斗爭——而且幾乎所有人都承受著壓力。教師們將這些告誡銘記于心。由于不確定如何最好地支持學生,許多人干脆變得更加寬容。要求被放寬,分數被提高,尤其是在遠程教學的那一年。
四是新教學方法。大約二十年前,《加強哈佛教學與學習契約》呼吁文理學院獎勵卓越的教學與指導,并改進教學法和學生學習。自那以后的多年里,教師們超額響應了這一號召。然而,其中一些變化帶來了意想不到的后果。例如,許多人從高風險考試轉向更頻繁的低風險作業,認為這將幫助學生掌握材料。但一些人發現,低風險作業在獎勵努力方面比在評估表現方面更有效,這給了學生一種錯誤的感覺,認為他們已經掌握了其實尚未掌握的材料。同樣,教師從考試和論文轉向替代性評估模式,如創意作業和小組項目,希望以此增加學生對其課程的投入度。然而,一些教師難以對這些作業進行充分區分度的評估。最后,一些教師摒棄了傳統的評分方式,轉而采用不評分、契約式學習或其他系統,在這些系統中,學生完成所有指定作業即可獲得A。這些替代方法在教學法上自有其道理,但它們與哈佛目前依賴分數進行區分的評分系統從根本上是不相容的。
報告總結道,我們不應責怪學生如此熱切地追求A,也不應責怪教師如此頻繁地授予A。這兩個群體都是在由相互競爭的激勵所構成的結構中,以及由關于學生需求和優秀教學內涵的演變信念所驅動的文化中,理性地行事。如果希望改變評分,就必須改變那個系統和文化。
三、對策:多方協同推動評分體系回歸正軌
報告提出,扭轉現狀需要教師個體、教師集體與學院領導層三方面協同行動。
在教師個體層面,建議所有教師在春季學期開始前完成四項工作:
第一,回顧課程歷年成績分布,反思課程在過去如何評分。文理學院評分分布儀表板提供了這些信息。2015年的評分并未過于嚴苛,但確實給出了更廣泛的成績分布,這一先前的分布或許可作為當前有用的目標。
第二,審視作業結構及其權重配比。教師應考慮恢復現場考試,這既是在生成式AI時代的審慎之舉,也有助于鼓勵學生掌握全部課程材料,并能產生更廣泛的成績分布。教師還應反思給予"努力"(如出勤、完成習題集)多少權重,而非基于"掌握程度"評分,并判斷基于努力的評分是否導致成績虛高。
第三,明確闡述評分標準。教師應向學生解釋每個成績等級所代表的含義。學生可能不清楚某一學科中"優秀"或"卓越"的作業標準,甚至可能不知道成績評估的是作業的質量。
第四,統一課程各部分的評分標準。學生因評分不一致而感到困擾,至少應確保同一課程內的評分一致。
在教師集體層面,可以采取共同行動。教育政策委員會目前正聚焦于以下可能性:
第一,允許教師授予有限數量的A+。目前,哈佛允許教師評定B+和C+,但不允許評定A+。允許教師在每門課程中授予有限數量的A+,將更有助于了解優秀學生的水平,從而提升成績評定的價值。
![]()
第二,在成績單上記錄每門課程的成績中位數。目前,哈佛未對學生所獲成績提供任何背景信息,而是依賴關于哪些課程評分更嚴或更松的傳言。記錄每門課的成績中位數將提供有用的背景信息。它也將減輕學生目前因選擇評分寬松課程而感受到的壓力,因為這樣做的收益將減少。
第三,創建一個基于方差的評分系統供內部使用。目前,哈佛內部也使用為外部受眾準備的成績單(如PBK、榮譽獎等)。委員會目前正在探索此類成績的內部替代系統。
最后,文理學院和哈佛學院領導層必須采取措施,以減輕當前扭曲評分的壓力,必須確保評審過程同時獎勵嚴謹和有意義的教學,并且選課人數期望是合理和明確的;同時讓困難學生在課堂外獲得所需的支持,以便他們能在課堂內被寄予最高的標準。另外,讓學生理解實現自身目標實際需要何種成績,如何理解并從令其失望的成績中吸取教訓,如何疏導與他們的雄心密不可分的壓力,以及如何培養對成就的成熟態度。
四、愿景:賦予學生有意義的教育
報告最后強調,哈佛有責任為學生提供一套有效的評分體系——既能傳遞清晰的信號,幫助他們準確認識自身優勢與不足,同時向雇主和招生委員會展現其突出領域。
同時,哈佛還還應當向學生提供既嚴謹又有意義的教育,一種能讓學生由衷覺得"值得"的教育。這種“值得”對于不同的學生感受不盡相同。對一些學生而言,當教師似乎關心他們的學習時,一門課程就感覺“值得”;對另一些學生而言,重要的是“切實的收獲”。
報告總結道:“我們的學生一如既往才華橫溢,能力出眾,我們對教學的投入比以往任何時候都更加堅定。只要同心協力,我們就能扭轉過去十年的偏離趨勢,讓學術重新成為本科教育的核心。”
爭議與反響:學生群體的質疑與擔憂
該報告發布后,在哈佛學生中引發了強烈反彈。超過20名受訪學生向《哈佛深紅報》表示,該報告曲解了他們的學術體驗,并可能給本已高壓的校園環境增添更多壓力。[2]
許多學生駁斥了報告中關于學習投入不足的暗示。一位學生描述了校園內的普遍現象:“如果你在午夜12點去拉蒙特或卡博特圖書館,那里每晚都座無虛席。人們關心自己的學業,犧牲睡眠,犧牲朋友聚會,已經為成績付出了太多。”學生們警告,若沒有相應的教學質量提升,僅推行更嚴格的評分,會將他們的關注點從學習本身異化為對分數的追逐。
報告內容引發了對心理健康的普遍擔憂。一位新生表示:“這讓我重新思考選擇哈佛的決定,我高中拼命學習才考進這里,原本期待大學能通過學業獲得充實感,而不是被學業壓垮。”另一名學生也表達了類似的焦慮:“我無法在學習材料時達到最大的享受,因為我如此焦慮期中考試,如此焦慮論文,而且我知道評分非常嚴苛。如果那個標準再提高,還指望人們能享受課堂是不現實的。”
學生們還認為,報告忽視了課外活動對哈佛身份認同的核心價值。有學生強調:“哈佛學生之所以成為哈佛學生,正是源于他們對課外活動的投入。現在我們得拋棄所有這一切,只追求學業?我認為這攻擊了哈佛的根本理念。”一名學生運動員則從現實角度提出批評:“這對學生是一種損害,因為它沒有真正考慮到我們日常必須做的事情,以及我們投入在團隊、身體保養,然后還有學業上的無數小時。”
盡管有學生同情報告立場,但他們警告單方面行動的后果。一位高年級學生擔憂道:“僅在哈佛解決這個問題,對于希望繼續深造或需要這些高分的潛在學生來說是危險的。我擔心我們在沒有完全理解它如何影響學生職業發展的情況下,就去解決這個問題,是本末倒置。”另一名學生則指出了更深層的問題:“我們首先處于這種情況是有原因的,你如此害怕你的GPA下降0.1或0.2,這表明一場真正的危機正在發生。”
資料來源:
[1] Amanda Claybaugh. Re-Centering Academics at Harvard College: Update on Grading and Workload. https://oue.fas.harvard.edu/faculty-resources/report-on-grading/
[2] Wyeth Renwick & Nirja J. Trivedi. ‘Soul-Crushing’: Students Slam Harvard’s Grade Inflation Report. https://www.thecrimson.com/article/2025/10/30/students-react-grading-report/
[本文為教育部國別和區域研究基地中國教育科學研究院國際教育研究中心成果]

本文由中國教育科學研究院“教育國際前沿”課題組成員整理,課題組負責人張永軍,編輯劉強,內容僅供參考。點擊左下角“閱讀原文”可下載該文獻。
本文為原創,轉載請注明出處。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.