![]()
推理模型在AI領域并不少見。許多公司都擁有此類技術,包括OpenAI的GPT-o3和谷歌的Gemini 2.5。但AI圖像和視頻公司Luma AI剛剛發布了其首款AI推理視頻模型Ray3,現已上線可用。
推理模型是一種使用更多計算時間來處理請求并能回過頭檢查答案的AI模型。通常情況下,推理模型能提供更好的響應,無論是更詳細的內容還是更低的錯誤率。
對于Ray3而言,這種推理能力意味著你可以創建包含更復雜動作序列的AI視頻片段。通常,AI視頻片段的時長在5到10秒之間。(這是最佳時長——更長的片段往往會很快變得不穩定。)因此在提示詞中加入動作序列會留下很大的出錯空間。Ray3花費更多時間處理提示詞的能力使其能夠更好地處理那些更高級的場景。
Luma AI首席執行官Amit Jain表示,推理模型的作用不僅僅是將文本轉換為像素。
"它能夠評估并說,'哦,這樣不好,或者我需要在這方面做得更好,'"他在接受CNET采訪時說道。
與聊天機器人的推理模型一樣,你可以看到模型工作時采取的步驟。一個新的可視化標注工具會顯示模型正在做什么——比如標記需要調整的角色和其他需要保持不變的區域。你也可以使用此功能來標記幀并突出顯示你希望在后續提示中進行的更改。
其他升級功能有助于制作更好的視頻片段,包括能夠以16位HDR生成,這是一種更高分辨率,能為視頻片段提供更精細的細節和清晰度。你還可以利用新的草稿模式,讓你快速測試想法并以較低分辨率格式生成鏡頭。Jain解釋說,你可以在草稿模式下在20秒內生成片段,然后在準備好時將其升級到高保真分辨率,這大約需要2到5分鐘生成時間。
視頻創作正成為生成式AI越來越常見的應用。過去一年中,許多大型科技公司都發布了AI視頻模型,從Midjourney到谷歌的Veo 3。所有這些模型都旨在增強創作能力,最近的改進包括生成更高質量、包含音頻(對于Veo 3)并普遍提升水平以吸引專業創作者和AI愛好者。不過,專業人士對AI生成媒體表達了許多擔憂,特別是關于AI模型的訓練和部署。藝術家們已經對AI公司提起了多起集體訴訟。Luma AI的隱私政策表示,它可以使用你提供的信息來改進其服務。
Q&A
Q1:Ray3推理視頻模型有什么特別之處?
A:Ray3是Luma AI首款AI推理視頻模型,它能夠使用更多計算時間處理請求并檢查答案,這使得它能夠創建包含更復雜動作序列的AI視頻片段,比傳統AI視頻模型處理高級場景的能力更強。
Q2:Ray3的可視化標注工具是如何工作的?
A:可視化標注工具會顯示模型工作時采取的步驟,比如標記需要調整的角色和其他需要保持不變的區域。用戶也可以使用此功能來標記幀并突出顯示希望在后續提示中進行的更改。
Q3:Ray3的草稿模式有什么好處?
A:草稿模式讓用戶快速測試想法并以較低分辨率格式生成鏡頭,可以在20秒內生成片段,然后在準備好時將其升級到高保真分辨率,整個高質量生成過程大約需要2到5分鐘。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.