# 點擊藍字 關注我們 #
![]()
![]()
近日,北京科技大學郝旭副教授團隊與北京航空航天大學同凡副教授團隊聯合提出一種基于強化學習方法的出行感知電動汽車充放電控制策略,優化V2B-PV系統能量協同管理,為交通電動化、建筑用能屋頂光伏可再生能源融合提供新方案。
![]()
文章亮點
![]()
1.針對電動汽車出行行為的異質性與可再生能源發電的不確定性等挑戰,提出“面向出行特征的強化學習充放電控制框架”。
2.通過深度Q網絡(DQN)算法實現電動汽車、建筑與光伏系統(V2B-PV)的聯合用能調度,實現接近離線優化算法的系統表現。
3.所提出的強化學習控制策略在真實數據測試中相對傳統控制算法降低充電成本55%、減少碳排放11.6%、提高光伏利用率至95%。
4.系統量化電動汽車出行時間與建筑負荷信息對充放電管理策略的信息價值(Value of Information, VOI)。
5.所提出的強化學習控制策略具有較快計算效率(毫秒級),可適配近實時控制場景,為智能交通-建筑-電網協同提供新范式。
![]()
內容簡介
![]()
交通部門約占終端能源二氧化碳排放的三分之一,其中公路交通貢獻達75%。電動汽車被視為脫碳轉型的關鍵技術,但如果充電行為不受控制,可能加劇電網高峰負荷壓力。電動汽車有序充放電可以降低成本、增強電網韌性,并提升可再生能源的利用率。然而,消費者出行模式的異質性以及可再生能源發電的波動性對現有控制策略提出了重大挑戰,現有控制策略求解面臨“維度災難”等問題。本研究提出一種考慮出行特征的深度強化學習充電控制策略,基于北京市高層辦公樓一年光伏發電和用電負荷的真實數據,采用深度Q網絡算法,綜合考慮最小化充電成本和最小化光伏發電棄電率等目標。
研究結果表明,該框架實現了低充電成本、低棄電率和較低碳排放——其表現接近具備完美信息的離線優化算法,并顯著優于隨機充電、盡快充電和貪心充電等傳統算法。具體而言,強化學習算法相較于隨機充電算法,可降低充電成本55%,減少碳排放11.6%,實現95%的光伏利用率。進一步分析表明,關于電動汽車出行時間與建筑用電需求的信息價值分別為2.4元/車/天和0.7元/車/天。研究結果表明,在“車輛—電網—建筑—光伏”集成系統中,強化學習在優化電動汽車充放電行為方面具有可行性與有效性。
![]()
研究方法
![]()
在“雙碳”目標與高比例可再生能源并網背景下,電動汽車以其靈活的儲能屬性成為分布式能源系統的重要節點。然而,出行模式的隨機性與光伏發電的不確定性,使傳統充電控制策略易陷入“維度災難”與高成本運行。針對這一難題,北京科技大學與北京航空航天大學團隊提出基于深度強化學習的考慮出行異質性的車-建筑-光伏系統充放電調度框架,以實現充電成本最小化與光伏消納最大化。研究構建了含樓宇負荷、屋頂光伏及多輛電動汽車的車-建筑-光伏系統模型,并采用DQN算法學習最優充放電策略。系統狀態包括過去24小時電價、電動汽車電量狀態、建筑凈負荷與出行時段信息;動作為空間離散的充、放電決策;獎勵函數綜合了充電成本、光伏利用率、充電不足與過放懲罰等因素。相比傳統控制策略,強化學習控制策略能夠在電價波動、光照變化及多用戶行為異質性條件下實現自適應決策。研究基于北京高層辦公樓的實測數據(含8760小時光伏出力和用電負荷)開展仿真。結果表明,強化學習算法在無未來信息的情況下,其運行性能接近理論最優的離線優化算法。
![]()
圖1. 本文建模框架
![]()
圖文導讀
![]()
隨著全球電動化與分布式可再生能源的快速發展,電動汽車正逐漸演變為分布式儲能與能量調節的關鍵節點。然而,電動汽車的出行行為具有明顯的隨機性,而光伏發電又受天氣與時段強烈影響,兩者的疊加不確定性使傳統充放電控制策略在多目標優化中面臨“維度災難”。這類系統若缺乏有效協調,不僅難以充分利用可再生能源,而且在用電高峰可能形成新的負荷沖擊,削弱電網的靈活性與穩定性。
為此,北京科技大學與北京航空航天大學合作團隊提出了一種“面向出行特征的強化學習”充放電調控框架,聚焦于建筑—車輛—光伏系統(V2B-PV)的動態能量優化。研究創新性地將電動汽車的出行規律與建筑用能特征引入RL決策過程,以最小化充電成本、最大化光伏利用率、并降低碳排放為核心目標,構建了一個能夠在不確定環境中自適應學習、自適應優化的能量調度系統。
01
數據特征
研究采用北京某高層辦公樓的實測數據作為實驗基礎。圖2中展示了六類關鍵輸入特征:光伏發電的日變化與季節性波動、電動汽車出行距離、到達與離開時間分布、建筑負荷曲線以及實時電價信號。全年8760小時的數據揭示了典型的“白天光伏高、傍晚用電高”的反向特征,也反映了電動汽車早進晚出的辦公出行規律。這些多源數據共同定義了強化學習環境的狀態空間,使算法能同時感知能源供給、需求與價格變化的動態關系。
![]()
圖2. 光伏發電、出行模式與負荷電價數據特征
02
強化學習控制策略訓練過程
在訓練階段,研究團隊使用DQN算法,智能體與環境交互不斷更新決策。模型采用經驗回放與ε貪婪策略平衡探索與利用,約2萬次迭代后即可收斂。圖3中左側展示了獎勵函數隨訓練輪次逐步提升的過程;右側為三天典型運行結果,電動汽車在光伏出力高或電價低時主動充電,在高負荷或高電價時段放電。強化學習控制算法在無未來信息的前提下實現了實時自適應決策,表現出優異的經濟性與穩定性。
![]()
圖3. 強化學習模型訓練與運行表現
03
強化學習控制策略能較好保障電動車主的出行需求
為了評估可靠性,研究比較了五種充電控制策略下電動汽車的出發荷電狀態。隨機充電與貪心策略的荷電狀態波動大,難以保證出行需求;傳統CASAP策略(盡早充滿)雖然避免充電不足,但造成系統性過充與高成本。相比之下,強化學習策略將荷電狀態穩定控制在60%–80%之間,與實際出行所需能量高度匹配,既保障續航,又減少過充,體現出精細化調控能力。
![]()
圖4. 不同策略下電動汽車荷電狀態分布對比
04
強化學習控制策略能實現接近理論最優解的充電成本
圖5給出了60天測試期內各策略的累計充電成本與日成本分布。結果表明,強化學習策略的累計成本僅為1438 CNY,較隨機充電降低55%,并接近擁有未來信息的理想離線優化算法。其平均日成本為18.99 CNY,波動范圍較小,體現出對電價與負荷變化的自適應能力。相比之下,CASAP策略為追求“充滿電”而付出高成本,隨機與貪心策略則出現大幅波動與充電不足懲罰。
![]()
圖5. 強化學習顯著降低系統充電成本
05
強化學習控制策略能顯著提升光伏發電消納
光伏發電的高效利用是實現低碳運行的關鍵。圖6顯示,在光照充足期,強化學習策略能精確匹配充放電時序,使系統內部的光伏發電消納率達95.3%,顯著優于CASAP(92.0%)與隨機充電(90.9%)。強化學習控制策略無需未來信息即可學習到與光照周期同步的充放電規律,表現出接近理想優化的能效水平,為建筑—交通融合系統的可再生能源利用提供了新思路。
![]()
圖6. 光伏能量利用率顯著提升
06
強化學習控制策略有效降低排放水平
在同等出行需求下,強化學習策略有效降低了系統碳排放。60天周期內,其累計排放量為14,681 kg CO?,比隨機充電減少11.6%;單位行駛里程排放強度僅110 g CO?/km,接近理論最優的106 g CO?/km。圖7中箱線分布顯示,強化學習策略的排放波動區間明顯更窄,說明其在應對可再生能源波動與電價變化時更具運行穩定性與環境韌性。
![]()
圖7. 強化學習實現碳排放最小化
07
強化學習控制策略在不同情景中體現出良好的適應性與魯棒性
在考慮光伏計費(PV Billing)情景下,電動汽車用戶需為光伏電力付費。研究重新訓練模型以同時優化電動汽車與建筑的經濟性。結果顯示,強化學習策略在新的計費機制下仍保持明顯優勢,累計成本約2034 CNY,僅增加77.1%。圖中可見,盡管成本上升,強化學習算法仍能維持合理的充放電節奏,避免了高峰時段購電與過度放電帶來的額外費用,展現出跨場景的適應性與魯棒性。
![]()
圖8. 光伏計費機制下的經濟性分析
08
出行時間和建筑負荷的信息價值
研究首次量化了不同環境信息在充電管理中的經濟價值(Value of Information,VOI)。當不提供電動汽車出行時間信息時,強化學習策略的平均成本上升146.9%,對應的信息價值約為5.74 CNY/車/天;若移除建筑負荷信息,成本增加19.5%,對應信息價值為1.36 CNY/車/天。圖9展示了兩類信息價值在60天周期內的波動情況。結果表明,出行時間數據對智能調度尤為關鍵,其獲取可顯著提高系統經濟性。
![]()
圖9. 信息價值:出行與負荷數據的經濟意義
09
強化學習控制策略算法效率和部署可行性
在保證最優性能的同時,強化學習模型具備極高的實時性。圖10對比了五種策略的平均計算時間:DQN每步推理僅需約10 ms,比離線優化算法快30倍以上。即使在多車輛、復雜負荷場景下,也能滿足實時決策要求。這意味著強化學習框架不僅在仿真中表現優異,更具備工程部署的可行性,可直接嵌入樓宇能源管理或園區級充電控制系統,實現低碳智能運行。
![]()
圖10. 毫秒級決策的計算效率
![]()
總結展望
![]()
通過出行特征感知與強化學習算法的結合,本研究實現了V2B-PV系統的低成本、高可再生能源消納與低碳運行。在不能完美得知未來系統信息的情況下,DQN模型能實現接近理想最優解,展現出強化學習算法在復雜能源系統調控中的巨大潛力。這一框架為未來“車—樓—光—網一體化”能源系統提供了可落地的智能決策方案。
![]()
原文信息
![]()
Mobility-aware EV charging and discharging management in V2B-PV systems: a reinforcement learning framework
作者:
Xu Hao, Pengju Liu, Hongyu Pu, Fuda Gong, Fan Tong*, Qi Chen, Lishuo Liu & Xiaoru Chen
https://link.springer.com/article/10.1007/s43979-025-00142-x
DOI:
https://doi.org/10.1007/s43979-025-00142-x
Cite this article:
Hao, X., Liu, P., Pu, H. et al. Mobility-aware EV charging and discharging management in V2B-PV systems: a reinforcement learning framework. Carb Neutrality 4, 26 (2025). https://doi.org/10.1007/s43979-025-00142-x
![]()
![]()
掃碼獲取原文
![]()
通訊作者信息
![]()
![]()
同凡,北京航空航天大學,副教授
研究領域
能源系統可持續性轉型系統評估,低碳能源技術綜合評價。
個人簡介
同凡,北京航空航天大學經濟管理學院副教授,教育部首批哲學社會科學實驗室(培育)北航低碳治理與政策智能實驗室主任助理。從事低碳技術評估、電力-交通系統耦合轉型研究。主持國自科青年項目、北京市發改委政策研究課題、北航青年拔尖人才項目、北航航空航天專項啟動經費等科研課題。作為骨干,參與教育部基礎學科與交叉學科突破計劃、國自科國際合作重點項目、國家重點研發計劃、國家高端智庫重點研究課題、中國工程院戰略研究與咨詢項目、工信部指導性軟課題。在Nature Sustainability, Nature Communications, Joule, Environmental Science & Technology (ES&T), Applied Energy, Carbon Neutrality, iScience等高水平期刊發表學術論文二十余篇,ESI高被引論文1篇。第一作者論文獲ES&T 2021年最佳論文。作為骨干,獲工信部優秀研究成果一等獎(2024年)、美國產業界獎項R&D 100 Award(2023年)、北航優秀教學成果特等獎(2024年)。擔任學術期刊Engineering, Carbon Neutrality青年編委,Nature Cities、PNAS等國際學術期刊匿名審稿人。
聯系方式
E-mail: fantong@buaa.edu.cn
圖文來源:原文作者
編輯:Carbon Neutrality編輯部
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
Carbon Neutrality 是由上海交通大學與Springer Nature合作出版的低碳科學與技術、碳金融與碳管理領域的國際跨學科綜合期刊。本刊旨在打造碳中和領域旗艦期刊和國際一流期刊,主要刊載低碳相關領域具有高度原創性、能夠反映學科水平的高質量研究論文和評論性綜述文章,為國內外從事低碳研究的專家學者提供一個專業的國際學術交流平臺。
期刊創刊主編由上海交通大學講席教授趙長穎擔任,12名中國兩院院士擔任顧問編委,國際編委26名(占比50%),第四屆國家氣候變化專家委員會成員4名,全球高被引科學家7名,中國高被引學者25名。
目前已被ESCI、EI、Scopus、CAS、DOAJ數據庫收錄,成功入選2023中國科技期刊卓越行動計劃高起點新刊項目。創刊三年即獲首個影響因子 12.5,位列 JCRQ1區。
Carbon Neutrality文章處理費(Article Processing Charge)全免,竭誠歡迎國內外低碳領域專家、學者積極投稿,攜手共建碳中和領域全球科學社群!
轉載、合作、咨詢歡迎后臺留言或聯系編輯部郵箱
CN_Editorial@sjtu.edu.cn
期刊網站:
www.springer.com/journal/43979
投稿系統:
www.editorialmanager.com/lowc/default.aspx
微信公眾號 | Carbon Neutrality碳中和
LinkedIn | @Carbon Neutrality
Facebook | @CarbonNeutralityCN
Twitter | @CN_Editorial
歡迎“分享”、“點贊”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.