
本期導讀
編者按
人工智能(AI)是新一輪技術革命的核心關鍵技術,為電影行業發展新質生產力提供了重要支撐,并將引發未來影像技術升級和觀影變革。自OpenAI Sora引發行業對AIGC文生視頻技術關注以來,Runway、Pika、谷歌Veo、可靈AI、海螺AI等相關工具百花齊放,呈現出強大的現實仿真能力。當前AIGC工具在物理規律理解等方面尚存缺陷,暫時無法直接用于電影內容生成,但AI已顯現出輔助影像與聲音內容制作和處理的強大能力,已初步實現人機協作和人機融合,并加快進入深度應用的智能體批量涌現階段。作為未來人工智能發展應用的主要方向,AI智能體有望呈現出類似人類智能的知識推理和決策能力,可破解通用大模型在電影行業應用的關鍵難題,實現更加高效、優質、可控的人機協作。本期遴選基于人工智能 技術的未來影像研究與思考、AI 音頻技術在電影對白和音效制作中的應用探究、圖片AI短片創制實踐、AI動作捕捉在虛擬預演中的應用研究等研究文章,從影像和聲音制作、虛擬制作、圖像處理等角度出發,分享和探討電影行業AI智能體的發展升級和應用實踐;同時遴選基于渲染引擎的VR眼動跟蹤數據可視化研究、數字影廳B環電聲響應技術標準解析和調試方法等技術論文,探討沉浸式視聽技術研究和實踐,歡迎廣大讀者關注。
——本期責編
專家點評
當前,全球電影行業已進入大科學、大視聽、大融合時代,多學科多業務交叉滲透明顯,生產流程持續優化升級,數字技術與實體經濟、網絡空間與現實社會融合發展趨勢日益明顯,進程不斷深化。以人工智能(AI)、大數據、云計算等新一代信息技術為核心的技術創新進入前所未有的密集活躍期,工程科技成為推動電影科技進步和產業升級的重要引擎。面向2035年電影強國建設目標,電影行業需聚焦AI技術自主研發與大模型行業定制、新型放映模式拓展、影院多業務融合等新領域新賽道,加快推動電影創新技術研發落地,統籌推進“十五五”電影科技發展預測分析、電影國際標準突破躍升、放映裝備國產化、電影重點實驗室創建等重點科技工作。隨著人工智能技術的持續演進,影像技術品質、視覺體驗、場景設計質量、制作效能持續提升,同時也給影像創作生產、傳輸分發、解碼播映等產業節點帶來風險和挑戰。構建既促進技術創新和產業升級,又確保安全可控并符合技術倫理的AI發展環境,是當前行業關注熱點和難點。《基于人工智能技術的未來影像研究與思考》一文,從電影創制、計算機圖形學、三維視覺等多維度出發,分析探討了AI在計算機模擬、虛擬攝制、模型驅動、影像呈現、電影內容創制等領域的應用實踐,提出了AI創制內容的審美策略和多樣化技術落地思考,為構建我國新一代影像創制解決方案提供了技術思路。本文觀點準確、內容詳實,將帶給從業者和讀者深層次的思考啟示,具有很好的行業指導意義和借鑒參考價值。
——龔波
正高級工程師
中國電影科學技術研究所(中央宣傳部電影技術質量檢測所)黨委書記、所長
在國家推動文化產業高質量發展的背景下,以AI大模型為代表的通用人工智能技術的發展與應用,將為電影產業帶來前所未有的變革。AI音頻技術通過精準模擬人聲和環境音效,不僅大幅提升了對白與音效的制作效率和質量,還顯著增強了影視作品的沉浸感與藝術表現力,為國產電影走向世界舞臺提供了強有力的技術支撐,助力中國故事以更加生動鮮活的方式呈現于全球觀眾面前,是實現中華文化自信自強的重要途徑之一。論文《AI音頻技術在電影對白和音效制作中的應用探究》梳理和回顧了AI音頻技術從20世紀50年代至今的發展歷程,有助于理解當前技術的演進過程和關鍵節點;對AI音頻制作工具進行了分類梳理,并從主要功能、代表性工具、特性及精度等維度進行了性能對比,有助于理清AI音頻工具的最佳應用場景;深入分析了相關技術在語音生成、動效生成、音響效果生成等電影對白生成和音效制作中的具體應用,展示了AI音頻技術在實際影視制作中的應用潛力。論文從應用角度指出了當前AI音頻技術在復雜情感表達、語種覆蓋范圍等方面的局限性并提出未來展望,為后續研究和發展應用指明了方向。
——王士進
正高級工程師
科大訊飛副總裁、訊飛研究院執行院長
認知智能全國重點實驗室副主任
智能科技已逐步應用于電影攝制過程中,極大地提高了內容生產效率,輔助創作者突破了例如換臉、減齡、場景修復還原等攝制難點。圖片AI短片制作或曰“AI動圖”技術,利用機器學習模型分析圖片內容,并基于原圖自動生成具有動態效果的圖像序列,最終合成高質量、流暢自然的動態視頻。該技術不僅提高了圖像處理的效率和質量,也為創意表達提供了更多可能,為用戶帶來更加豐富和動態的視覺體驗,并持續推動媒體展示和內容創制的邊界。鑒于影院大銀幕放映存在分辨率高、畫面大等特點,該技術推廣到大銀幕放映尚存在技術難點。《融合智能科技的影像藝術表現力多元化發展研究——以圖片AI短片〈故鄉〉創制實例為例》一文深度分析了圖片AI短片《故鄉》創作的理論基礎與技術實踐,從分層切割、算法提取、背景填充等方面闡釋了AI技術如何使圖片素材向動態轉化的技術性操作,同時AI技術也為短片解說、配樂等環節提供了與畫面藝術高度契合且更具個性化與多元化的創作方案。短片《故鄉》的創作過程是依托智能科技實現圖像與視頻兩種不同藝術載體相互融合與轉化的一次創新性探索與實踐。可以預見,未來在智能科技的加持下,電影藝術在內容表達、創作生產、表現形式、傳播渠道、觀影體驗等方面將會有更為生動且創新的突破。
——邢占宇
華夏電影發行有限責任公司副總經理
本期目錄
論壇實錄
◎ 基于人工智能技術的未來影像研究與思考
—— 陳寶權 李道新 孫立軍 夏 鵬
視聽科技教研
◎ AI音頻技術在電影對白和音效制作中的應用探究
—— 王 玨 李洽楠
◎ AI動作捕捉在影視虛擬預演中的應用研究
—— 董俊希 趙建軍 魯夢河
技術應用
◎ 融合智能科技的影像藝術表現力多元化發展研究——以圖片AI短片《故鄉》創制實踐為例
—— 李立新 周令非 段 毅
◎ 基于渲染引擎的VR眼動追蹤數據可視化研究
—— 焦垚楠
◎ 非渲染技術語境下沉浸式音頻空間構建方案的探索與思考
—— 林義超 張 澤
標準研究
◎ 數字影廳B環電聲響應技術標準解析和調試方法探討
—— 張 輝
研究與開發
◎ 深度反卷積神經網絡優化下的低質圖像去模糊數學模型
—— 亓金鋒
2024年總目錄
◎ 《現代電影技術》2024年總目錄
文章概要
基于人工智能技術的未來影像研究與思考
【摘要】 作為一種現代表達媒介和藝術形式,電影將視覺、聽覺等多種感官與記錄、敘事、抒情等元素融為一體,創造出令人難以忘懷的體驗。電影與計算機技術的緊密聯系,使其在過去幾十年中不斷進化,產生了如數字視效(VFX)、虛擬現實(VR)等諸多革新。近年來,隨著人工智能(AI)技術的快速發展,特別是OpenAI Sora等文生視頻工具的出現,使其在電影制作中的潛力備受矚目,并被認為可能顛覆電影創制全過程。本文基于2024中國計算機大會(CNCC2024)“AI與未來影像”論壇,回顧了計算機圖形圖像技術在數字影像發展過程中的重要支撐作用,探討了AI時代電影工業所面臨的機遇與挑戰,展望了AI技術在電影行業乃至未來影像領域的發展趨勢,對進一步推動電影與AI技術的深度融合進行了探索。
AI音頻技術在電影對白和音效制作中的應用探究
【摘要】 AI音頻技術在當前電影對白和音效制作領域備受關注且已逐步應用到實際制作中。本文介紹了AI音頻技術的主要概念及發展概況,對現階段AI音頻制作工具進行了分類整理,并按照電影對白和音效制作中聲音生成與聲音處理兩大應用場景,探討AI音頻技術在電影對白和音效制作中的應用進展與未來前景。研究表明,目前AI音頻技術可用于部分場景和部分類別的對白生成,但缺乏復雜情感表達能力;在動效和音響效果生成中可完成一定的素材準備,但精確度和豐富度有待提高。在聲音處理方面,AI音頻技術具備較強的音頻降噪及增強、對白音色替換、動態及響度控制、音色及空間處理能力,在聲音編輯和預混中已得到實際應用,但尚無法勝任聲音設計、混錄等需要高度依賴藝術創造力的環節,暫不具備獨立完成整部電影聲音制作的能力。
AI動作捕捉在影視虛擬預演中的應用研究
【摘要】 中小成本影視劇組的虛擬預演環節,通常采用預演軟件、關鍵幀動畫、傳統動作捕捉以及物理模擬等方法控制虛擬角色運動。然而,這些方法分別存在預演精度不足、耗時耗力、需配備專業設備及制作流程復雜等缺陷。針對上述問題,本文提出一種新的虛擬角色控制方法,利用AI動作捕捉技術實現了虛擬角色的運動控制,并進行了虛擬預演短片制作。通過簡化流程,實現了虛擬角色的動作捕捉,從而擴展了虛擬預演的應用范圍。實驗對比表明,該方法所呈現的數據精度能夠滿足虛擬預演需求,無需佩戴專業設備即可實現近似實時的效果,同時該方法性價比較高,且場地限制較小。
融合智能科技的影像藝術表現力多元化發展研究——以圖片AI短片《故鄉》創制實踐為例
【摘要】 在媒體融合和全媒體傳播的大環境下,新興技術加速轉化為新質生產力,如何利用技術實現文化表達、拓寬影視作品的創作思路,是當前電影技術應用領域的關注熱點之一。智能科技與藝術相融合對影像藝術表現力的影響,是電影學術研究和電影產業發展共同探索的方向之一。本文結合國內首部基于圖片的AI院線映前短片的創制實踐及相關理論研究,提出了智能科技與電影藝術相融合的規律性方法,并以實際案例進行驗證。研究結果表明,本文提出的基于圖片的AI短片制作方法具備藝術性、創新性和實用性,影院銀幕提升了相關內容的全媒體傳播效能,有助于實現影視作品類型的多樣化。
基于渲染引擎的VR眼動追蹤數據可視化研究
【摘要】 傳統眼動追蹤技術主要用于平面影像的認知研究。電影媒介在數字時代逐步從銀幕擴展至更多元的空間,虛擬現實(VR)眼動追蹤技術為電影研究提供了新的研究路徑。與此同時,借助實時渲染引擎對VR眼動追蹤數據進行可視化分析變得極為必要。本文介紹了眼動追蹤技術在電影研究中的應用及VR眼動追蹤技術可視化的研究現狀,提出了一種基于虛幻引擎的VR眼動追蹤數據三維可視化方案,并以多銀幕影院場景為例,詳細介紹了其實現方法和效果,以期為電影研究和未來影像創作提供新的視角和工具。
非渲染技術語境下沉浸式音頻空間構建方案的探索與思考
【摘要】 本文以沉浸式音頻技術為研究對象,系統探討了非渲染模式沉浸式音頻技術的理論基礎與實踐應用。文章首先對當前以渲染模式為主導的沉浸式音頻技術進行了深入分析,闡釋了其核心原理及其在音頻制作領域的廣泛應用,繼而著重論述了非渲染模式沉浸式音頻技術的理論支撐,詳細解析了該技術在聲道布局和聲像處理領域的創新方法,并結合新華社“全六覺”實驗室空間搭建和設備布局的具體案例,展示了其構建沉浸式音頻空間的有效性。最后,文章進一步探討了非渲染模式沉浸式音頻技術對音頻制作領域的深遠影響,包括其在技術創新、成本控制方面的優勢以及對音頻工作者思維模式的促進作用。通過對渲染與非渲染模式的比較分析,揭示了沉浸式音頻技術發展的多元趨勢和未來潛力。
數字影廳B環電聲響應技術標準解析和調試方法探討
【摘要】 數字影廳B環電聲響應特性是指數字影院音響系統對電信號的響應情況。本文首先概述數字影廳B環電聲響應特性相關技術標準,對GY/T 312—2017《電影 錄音控制室、室內影廳B環電聲響應規范和測量》中涉及的核心技術條款進行解讀,總結調試和測量過程中遇到的問題,最后提出一種合理的B環電聲響應調試方法,以期為數字影廳相關調試提供技術保障,推動國內數字影廳整體還音技術良性健康有序發展。
深度反卷積神經網絡優化下的低質圖像去模糊數學模型
【摘要】 隨著時間的推移,電影膠片由于存放時間長、存儲物理環境不一等原因會出現老化、褪色、劃痕和模糊等問題,而現存經典資料影片膠片在轉換為數字格式進行存儲后,大多仍存在隨機噪聲多、圖像質量不高等問題。為緩解上述問題,本文設計了基于深度反卷積神經網絡優化下的低質圖像去模糊數學模型,首先采用泊松分布法建立低質圖像退化方程,分析低質圖像的隨機噪聲;隨后構建低質圖像去模糊數學模型的初始框架,并利用深度反卷積神經網絡對其進行優化,確定損失函數,完成低質圖像去模糊數學模型的構建。實驗結果顯示,本文所提數學模型在實踐應用中表現出良好的低質圖像去模糊處理結果,峰值信噪比較高,可用于經典資料影片圖像畫面的修復,在低質圖像去模糊領域具備良好的應用前景。
文章全文詳見《現代電影技術》期刊
2024年第12期
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.