IT之家 1 月 13 日消息,南京農(nóng)業(yè)大學今日官宣,在上周的中國高等教育學會高等農(nóng)林教育分會 2025 年年會的分論壇“數(shù)智技術(shù)重塑農(nóng)林教育全維度變革”上,南京農(nóng)業(yè)大學正式發(fā)布司農(nóng)大語言模型(Sinong)。
![]()
該模型是國內(nèi)首個面向通用農(nóng)業(yè)領域的開源垂直大語言模型,同時也是南京農(nóng)業(yè)大學主導研發(fā)的首個農(nóng)業(yè)領域大語言模型。司農(nóng)大語言模型的發(fā)布,標志著南京農(nóng)業(yè)大學在農(nóng)業(yè)領域的人工智能基礎模型研究與應用新突破。
![]()
“司農(nóng)”模型重點立足服務農(nóng)業(yè)領域,命名取自中國古代財政與農(nóng)業(yè)管理官職體系。研究團隊依托學校農(nóng)業(yè)領域?qū)W科優(yōu)勢,收集了包括動物科學、農(nóng)業(yè)經(jīng)濟管理、農(nóng)業(yè)資源與環(huán)境、園藝學、智慧農(nóng)業(yè)、動物醫(yī)學、植物保護、作物育種等細分學科數(shù)據(jù),總量超過 40 億 token 的農(nóng)業(yè)領域?qū)I(yè)數(shù)據(jù),涵蓋了近 9,000 冊書籍、24 萬余篇學術(shù)論文和近 2 萬份政策、標準以及海量網(wǎng)絡知識,構(gòu)建了農(nóng)業(yè)基礎數(shù)據(jù)集。
在模型訓練階段,除傳統(tǒng)指令微調(diào)外,團隊引入了思維鏈和上下文參考等多維訓練數(shù)據(jù),提升了模型對于農(nóng)業(yè)專業(yè)知識的理解與生成能力。
此外,針對領域文獻知識利用效率問題,團隊推出多智能體檢索增強框架。該框架通過優(yōu)化知識庫構(gòu)建、智能查詢改寫、混合檢索等策略,使模型能夠精準調(diào)用專業(yè)知識,保障了生成內(nèi)容的準確性與時效性。
目前,司農(nóng)大語言模型已在魔搭社區(qū)和 GitHub 社區(qū)全面開源,發(fā)布了 8B 和 32B 兩種參數(shù)規(guī)模的版本。IT之家附開源地址如下:
- 魔搭社區(qū)開源地址:https://modelscope.cn/organization/NAULLM
- GitHub 社區(qū)開源地址:https://github.com/njauzzx/Sinong
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.