近日,福建農林大學農業人工智能研究院具身智能課題組在《Computers and Electronics in Agriculture》期刊發表題為“Accurate localization of fruit targets and picking points with multi-dimensional attention and dynamic upsampling”的研究成果。
![]()
該研究針對復雜農業環境中果實形態多變、采摘點區域微小、遮擋及背景干擾強等挑戰,研究團隊提出基于多維注意力與動態上采樣的MDAD-YOLO 檢測模型。該模型在特征增強階段耦合區域感受野注意力與通道—空間聯合注意力,提升對果實及采摘點的跨尺度/跨通道感知;在頸部結構中引入坐標注意力,提高果梗等細粒度結構的空間定位精度,并采用動態像素重組替代傳統插值,上采樣過程中更好地保留細節。最后通過級聯自適應細粒度通道注意與位置敏感注意,實現通道依賴關系的多層級建模,并協同強化空間上下文表征。實驗在辣椒和茄子跨數據集中克服了多種果實姿態和不同光照影響,在性能和精度上取得了SOTA。
![]()
MDAD-YOLO在辣椒和茄子多個數據集中實現了果實和采摘點精準定位
這項研究成果為實現高效、精準的果蔬自動化采摘提供了核心的視覺感知方案,有望解決農業生產中勞動力短缺和成本上升的痛點。未來,該技術可被集成到農業機器人或智能采摘裝備中,直接應用于溫室、果園等復雜環境。
![]()
第一作者
黃藝坤,福建農林大學計算機與信息學院2023級博士生,主要研究方向為具身智能、計算機視覺等。以第一作者在《Computers and Electronics in Agriculture》等期刊上發表多篇學術論文。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.