網易首頁 > 網易號 > 正文申請入駐

Medeo 教程：一次生成無腦抽卡不可取，真正的視頻 Agent 應該啥樣

2025-12-16 07:08:21　來源: 歸藏的AI工具箱

北京舉報

分享至

今年早些時候給大家介紹了 AI 視頻生成 Agent Medeo 的 0.5 版本，當時他們已經算是這個品類的先行者了。

后來又有很多視頻 Agent 發布，我也陸陸續續嘗試了一些，但發現大部分的執行路徑都非常死板，要不泛化性不強，要不完全無法通過自然語言指揮模型進行修改和調整。

前幾天拿到了 Medeo 的 1.0 版本，進步非常大，試了一下以后感覺相當驚艷，文章后有邀請碼抽獎。

非常短的提示詞可以出不錯的效果這個是基本功，但是他們也可以支持非常靈活的通過自然語言進行修改，支持超過上千字的超長提示詞，提供非常好的泛化性，各種風格和垂類視頻都可以做。

先來看一下我用他做的幾個視頻：

這是一個科普獵鷹九號助推器回收難度的視頻，非常清晰企且直觀的講解了獵鷹九號火箭回收的意義和難度。

為我設計的 Vibe Coding 鍵盤做的宣傳片，他可以很完美的還原任何產品，哪怕是全新設計的

將任何小說或者影視劇轉換為哈基米宇宙的風格，這里是《詭秘之主》中克萊恩蛻變的那部分劇情

這些視頻我都總結了提示詞，你們可以一鍵復刻，而且很通用，基本可以搞定一整個品類。

可以讓優質創作者將自己的創作智能和創作邏輯壓縮到提示詞里，并且軟件可以完美地實現。這個就是Medeo 1.0的魔力和能力，可以說是視頻領域的 Nano Banana Pro 時刻了。

學一下基礎操作

整個 Medeo 基本的一些功能，非常簡潔和直觀，即使你對視頻制作一竅不通也能上手。

1.第一個部分是他們的一些模板，這里不是只有畫面風格，他包含了畫面、臺詞、剪輯方式以及音樂等一系列優質視頻的必要要求，你可以選擇一個你喜歡的直接套用。
2.第二個部分很好理解了，你可以選擇生成橫版或者豎版視頻，這里目前只支持 16:9 以及 9:16 兩個常見比例。
3.第三個部分，里面支持超多的自定義設置，如果你對細節要求較高可以選擇，比如視頻時長、具體生成的類型只生成圖片或者是視頻、畫面風格、配音的聲音。
4.最后一個部分是素材上傳，支持直接從 URL 里面拉取其中的文本和圖片作為素材，也可以自己上傳對應的文本和圖片。

基本上，你在輸入框直接描述你的視頻生成需求，就可以開始創作。

而且這里你也不需要過于詳細地描述需求，因為 Medeo 是支持后續通過自然語言對生成的視頻進行修改的。

比如，這里前面有兩段素材重復了，你就可以告訴它這兩段素材的位置，然后讓它重新生成，并且替換。它可以很完美地執行這些操作。

當然，更簡單的是讓他自己找出重復的素材然后替換也行。

Medeo 幾乎支持市面上常見的所有圖像和視頻模型，由于非常強的泛化性，你可以通過提示詞指定他具體使用哪些模型生成圖片或者視頻，再或者直接用 Sora 這種模型直接生成完整視頻。

比如上面這里，他甚至非常聰明地自己在決定什么時候該用文生圖，什么時候該用圖生圖。

它規劃了分鏡以后，發現如果分鏡不包含具體的商品，就可以不用圖生圖，直接用文生圖來生成。

如果包含商品，它就會直接用圖生圖來生成。

而且這里我指定了它用 Gemini 來生成圖片以后，它就直接開始用 Nano Banana Pro 來生成圖片，而不是默認的SeeDream。

另外除了支持自然語言編輯，Medeo 依然支持在左側使用你熟悉的剪輯頁面編輯，這個也是獨一份的體驗。

你可以拖動每個分鏡的邊界線去控制分鏡的時長，也可以直接在 Audio script 部分編輯對應文案，還能具體定義每個音頻的音量和時間。

我也做了張長圖可以幫你一張圖了解 Medeo 的基礎使用：

干中學：看幾個案例和提示詞微縮模型風格的科普視頻

靈感主要來源于我前幾天做的 Nano Banana Pro 提示詞，只需要向模型提供小說、影視劇或者真實事件的名稱，就可以幫你生成一張非常漂亮的微縮模型海報。

于是我就想如果這個風格可以做成視頻是不是效果更好，表現力更強，剛好測試一下 Medeo 對于復雜提示詞的遵循和泛化能力。

于是我就寫了一提示詞，里面詳細描述了關于畫面風格、口播臺詞和資產一致性等要求。

這里我也沒細想，尤其是在編排和臺詞的腳本方面，沒有過多的去要求。

然后它出來的結果，畫面風格上是非常漂亮的，動畫也非常好。但是講述上有些謎語人，有些看不懂，就是沒有實質性內容。這也是很多創作者或者是AI創作內容容易犯的一個錯誤。

于是我就讓他自己反思了一下，讓他去自己思考說這種科普內容的腳本應該怎么寫。

在他自己反思和給出第一步的改進方案之后，我又跟他討論了一些不足的點，完善了講解的結構，最后讓他執行，結果已經相當完美了。

我也根據我們跟他的討論，優化了一下最終的提示詞。

微縮模型風格小說世界觀講解或者科普視頻 Medeo 提示詞：

項目指令：小說世界觀微縮導覽 or 基于微縮模型的科普短片

主題：[基地-銀河帝國世界觀介紹] or [SpaceX 獵鷹重型雙助推器同步回收科普]

項目目標：以“桌面沙盤”的上帝視角，配合詼諧毒舌的解說，制作一部小說世界觀或者真實事件的科普短片。

一、視覺法則，用 Gemini 生圖

場景移軸微縮模型化：場景定義：找出一個最具代表性的名場面或核心地點。在畫面中央，將這個場景構建為一個精致的軸側視角3D微縮模型。風格要采用夢工廠動畫那種細膩、柔和的渲染風格。你需要還原當時的建筑細節、人物動態以及環境氛圍，無論是暴風雨還是寧靜的午后，都要自然地融合在模型的光影里。微距模擬：模擬人類用微距鏡頭觀察沙盤。大量使用淺景深 (Shallow Depth of Field) 和移軸效果，背景必須虛化。運鏡方式：依靠攝像機的平滑橫移 (Pan)、推拉 (Dolly) 和焦點切換 (Rack Focus) 來引導視線，而非物體運動。二、音頻與解說 (Audio & Persona) 關于背景，不要使用簡單的純白底。請在模型周圍營造一種帶有淡淡水墨暈染和流動光霧的虛空環境，色調雅致，讓畫面看起來有呼吸感和縱深感，襯托出中央模型的珍貴。

二、解說人設：視角：抽離的“造物主”或“高維觀察者”。基調：語速輕快，充滿冷幽默 (Dry Humor) 和毒舌感。用輕松隨意的語氣解構殘酷或宏大的設定，打破第四面墻吐槽世界的荒謬性。

三、配樂：類似于《模擬城市》或《文明》的輕快背景樂，帶有探索感，與畫面內容的沉重形成反差。

四、劇本結構模板：

如果是世界觀介紹執行：世界觀科普視頻的腳本寫作核心在于信息的系統性和清晰度,而非氛圍營造。首先必須梳理世界觀的骨架結構,包括關鍵地點(哪些星球、城市、區域)、核心人物(他們的身份和作用)、時間線(重大事件的先后順序)、以及支撐世界運轉的核心概念或法則。腳本不能追求文學性或懸念感,而要用平實的紀錄片語言,把"是什么"說清楚,把"為什么"講明白,把"怎么發展"理順楚。每個信息點都要具體化,避免抽象描述,。時長要充足,不能為了追求短視頻節奏而壓縮關鍵信息,寧可做到90-120秒把世界觀講透,也不要做30秒讓人云里霧里。最重要的是,寫作前必須問自己:一個完全不了解這個世界的觀眾,看完后能否搞清楚這個世界由什么組成、如何運作、發生了什么故事,如果答案是否定的,那就是失敗的科普腳本。

如果是真實科普執行：科普類短視頻的腳本寫作核心在于構建完整的認知閉環，而非單純展示結果。首先必須建立清晰的敘事結構框架，通常采用"鉤子-問題-解決-意義"四段式：開場用震撼畫面或極端類比快速抓住注意力，讓觀眾產生"這是什么"的好奇心；隨后必須交代背景和問題，說明"為什么需要關注這件事"，通過對比傳統方法的痛點或局限性，讓觀眾理解技術革新的必要性；接下來是核心科普段落，這是最容易被忽視但最重要的部分，必須詳細拆解"他們是如何做到的"，將復雜技術分解為3-5個可理解的步驟，每個步驟用簡潔的語言說明原理，配合具體的數據量化和生動的類比，讓抽象概念變得可感知；最后是意義升華，不能輕飄飄地結束，而要回扣主題，說明這項技術帶來的實際影響或更大的啟發意義。在語言表達上，要善用對比制造沖擊力，比如"傳統方法 vs 新技術"的before-after對比，用具體數字而非抽象形容詞來量化難度和成果，同時運用生動的類比將專業術語轉化為日常經驗，

有些部分是他自己跟我討論以后總結出來的。所以，這部分提示詞應該是我和Medeo共創的。你們也可以學習一下我和Medeo這種共創提示詞的方式。

然后用這個提示詞做了一個關于基地小說里面銀河帝國世界觀的介紹，他做得相當不錯。

生活化電商產品宣傳片

我前幾天自己設計了一個專門用來 Vibe Coding 的鍵盤。這個鍵盤比較獨特，它支持語音輸入，還有一些特殊功能。

長得跟現在的市面上的鍵盤不太一樣，所以就想試一下 Medeo 做電商產品的宣傳片效果怎么樣。

這個地方主要考驗的是還原度。而且因為是自己設計的，長得跟市面上所有產品都不一樣，剛好用來考驗它，因為它不包含在模型里面。

可以看到，這里我的渲染圖可能是偏向香水的，或者這種偏生活化的方式去展示。這是現在很多做廣告的方式，就是幫你賣生活方式，而不是干巴巴地介紹產品。

于是我就搞了一個提示詞，就可以幫你將任何產品變成這種類似于香水的售賣生活方式的一個宣傳片，更貼近你的生活。讓你知道有了這個產品以后，你的生活會變好。

這個提示詞沒有什么迭代過程，它生成的效果非常好，幾乎一次就生成了。除了中間我前面演示的，為了湊口播時長，剪了兩段相同的素材上去以后我改了它以外，基本上就是一次生成。

而且商品的還原真的非常完美，就是連商品上的圖標、按鍵顏色，包括開孔位置都還原了，包括旋鈕的質感。

如果你想做商品宣傳類的視頻，就在上傳的部分（輸入框左下角），把你的商品最好是三視圖以及它的一個包裝視圖上傳上去，然后加上我這段提示詞就可以了。

Medeo 生活方式商品宣傳廣告視頻提示詞：

你的角色 (Role)

你是一位推崇“感官美學”的視覺藝術總監。你的專長是將任何實體產品（無論它多么工業化或科技化）解構為一種藝術體驗和生活方式。你的風格參考對象包括：Atelier Cologne（歐瓏）、Aesop（伊索）、Loewe（羅意威）以及 Kinfolk 雜志。

分鏡圖片中的產品必須與我上傳的產品圖一致，使用 Gemini 生成分鏡圖片，Sora 生成視頻。

核心任務 (Core Task)

接收用戶上傳的產品圖片或描述，運用“分形藝術（Fractal Art）”與“生活流（Slice of Life）”相結合的手法，生成一支 30-60 秒的概念視頻腳本與視覺生成提示詞。

嚴禁事項：

禁止使用“賽博朋克”、“高科技”、“霓虹燈”、“全息投影”等科技圈陳詞濫調。
禁止像說明書一樣羅列功能參數。
禁止畫面生硬、死板。

抽象化處理邏輯 (Abstraction Logic)

你必須按照以下三個步驟處理輸入的產品：

第一步：視覺解構 (Visual Deconstruction)

提取產品的核心幾何特征（圓形、方形、倒角、紋理）。
提取產品的材質情緒（金屬的冷冽、木頭的溫潤、玻璃的通透、織物的親膚）。
生成指令：基于這些幾何與材質，生成一組分形（Fractal）或萬花筒式的抽象動態背景。讓產品在抽象的幾何流動中若隱若現，形成一種視覺上的“韻律”。

第二步：感官通感 (Synesthesia)

將產品的“功能”轉化為“感覺”。
尋找一個美好的生活方式，將其與產品畫面進行蒙太奇剪輯。

第三步：人文場景 (Human Context)

置景必須是極具生活氣息且高級的（由自然光主導）。
人物狀態必須是松弛的、享受的，處于一種“心流（Flow）”狀態，而不是在“工作”或“操作機器”。

輸出模板 (Output Template)

請根據用戶輸入的產品，嚴格按以下結構輸出方案：

A. 視覺基調定義 (Visual Key)

光影設定：（例如：晨曦、午后漫反射、燭光、丁達爾效應）
核心材質與色彩：（提取產品色與環境色的互補關系）
抽象元素：（描述由產品形態演變而成的分形圖案，如“由鍵帽方塊組成的無限延伸的幾何迷宮”）

B. 視頻分鏡流 (Storyboard Flow)

(請包含 5-6 個鏡頭，必須交替使用“微距特寫”、“抽象分形轉場”和“生活遠景”)

鏡頭 1 [引入]：環境空鏡或抽象幾何的極慢速流動（由產品特征生成）。
鏡頭 2 [觸感]：極致微距。聚焦材質紋理。
鏡頭 3 [交互]：人物極其優雅、緩慢的使用瞬間（結合自然光）。
鏡頭 4 [通感]：也就是你提到的分形/生成藝術畫面。用畫面表現“思維/聲音/氣味”的形狀。
鏡頭 5 [共存]：產品靜置在生活場景中，與書本、植物或茶杯共存。

C. 聽覺設計 (Audio Design)

音樂風格：必須是聲學樂器（鋼琴、大提琴、豎琴）或極簡氛圍音（Ambient）。
環境音 (Foley)：極其細膩的 ASMR 聲音（風聲、書頁翻動聲、呼吸聲）。

D. 獨白文案 (The Monologue)

(生成一段像散文詩一樣的旁白，不要提及任何技術名詞，只談論時間、空間、靈感與陪伴)

產品介紹文案為，可以參考：

哈基米抽象文學影視劇講解視頻

最近各種哈基米抽象的歷史、文學、影視劇講解視頻非常火爆。

具體的表現就是把里面的一些角色替換為目前比較流行的Meme角色，比如說茂迭、奶龍、露露，還有那只非常煩人的企鵝。而且一些文案的話也會被替換成Meme上比較貼近的文案。

于是我就分析了幾個這樣的視頻，然后抽象了一下它們的特點和理念，我寫了一套提示詞。

就是按剛才第一次我們說的那個迭代的方式，哪有問題，然后就讓它改。改完了以后呢，再把改的內容或者是一些它自己發現的點，填回到提示詞里去。

因為他模型本身是不知道這些非常抽象而且火熱的Meme角色是什么的，所以我們需要將這些角色圖片做好標記上傳上去。

這里我直接找了幾張圖片，然后打字進行的標記，你要是懶得自己搞可以用我這個。

之后，把這個迭代好的提示詞和這幾個角色一起扔給他，然后讓他做一個《詭秘之主》第一卷末尾劇情的講解。

他做得非常好，非常完美。在語氣上，比如“哈基米”這種詞的替換，比如說“叉叉咪”這種人稱代詞的替換。

包括說這些詞應該在什么地方用，以及這個角色符合，這幾個Meme角色符合了原著中的那個角色。

而且圖像模型很好地把握住了這個小說背景的風格和內容。就比如說，它的制服和服裝都是非常具有西方玄幻的那種色彩的。同時整個建筑風格也非常像舊時代倫敦霧都的那種風格。

這方面說明模型的智能是非常強大的，無論是在美學上還是在多模態上。

Medeo 哈基米 Meme 風格小說、影視劇、真實事件講解視頻提示詞：

請啟動全流程視頻創作模式，基于我提供的經典影視劇或小說《詭秘之主》的劇情邏輯和關鍵的一段劇情，制作一段風格獨特的第三方敘事視頻，先檢索或者在知識庫中查找這個小說或者影視劇的經典橋段或者世界觀。

首先，請深入分析我上傳的參考圖片中的角色形象（例如耄耋、企鵝、奶龍、嚕嚕等），提取它們的生物特征與神態，生成圖片的時候，務必要保證它們的（面部和身體）露出服裝外面的部分要與原圖完全一致，用Gemini生成圖片的時候，不要把名字寫到提示詞里，就只說根據我上傳的參考圖生成什么什么圖片就行，防止名稱誤導模型并利用你的知識庫檢索原著作品中主角與反派的經典造型。你需要將這些萌寵角色無縫代入原著角色的身份，要求它們身著原著中極具辨識度的古裝、戰甲或現代戲服，衣物材質要有布料或金屬的真實紋理，只有頭部或者漏出的身體采用 Meme 的形象，服裝還是原著的服裝。但身體比例和臉部特征保持原有的萌系或滑稽感，形成一種強烈的反差萌。

畫面風格方面，采用水墨風格迪士尼皮克斯風格的2.5D高品質渲染。需要使用 Gemini 生成圖片，角色裝扮需要符合原著，光影要明亮且富有通透感，使用次表面散射（SSS）技術表現角色皮膚或毛發的細膩質感，背景采用微縮景觀般的精致建模，色彩飽和度適中，營造出一種像是置身于高昂動畫電影中的視覺體驗。

劇情構建與分鏡生成上，根據我提供的劇情內容，務必保證敘事的完整，不要偷懶節省圖片和鏡頭，鏡頭語言要流暢，多使用緩慢的推拉鏡頭來強調情緒的轉變，必須以耄耋這只貓咪為主角，其他群眾也是貓咪的樣子，主要配角選擇“奶龍”、“嚕嚕”或者“企鵝”。

最后，也是最關鍵的，請生成一段第三人稱的旁白口播文案，并配上深沉但略帶反差的紀錄片式男聲。文案必須嚴格遵守以下“哈氣和哈基米”的語言體系：將所有人類種族或家族稱為“某某咪”（如蕭咪、納蘭咪）；將所有的攻擊、斗氣、內力或魔法或者權謀斗爭統一稱為“哈氣”；在描述劇情的關鍵道具的時候，在道具名稱后加上“南北綠豆”這個詞作為完整的道具名稱；將原本嚴肅的修煉等級或地位描述得像是在幾個 Meme 打架。旁白語調要一本正經地胡說八道，配合畫面中萌寵們嚴肅又滑稽的表演，完成對原著經典橋段的解構與重塑。

具體的文章內容為： XXXXX

他們為什么可以做好

從官號和跟他們日常聊天了解了一下，他們為了實現質量和靈活度都兼顧的 Agent 架構做了哪些事情。

傳統的視頻生產產品，其實一直以來都面臨著如何解決和平衡使用門檻、生產成本和效果控制這個不可能三角的難題。

一些產品可以產出非常復雜而且高質量的內容，但是與此同時帶來非常高的使用門檻和學習操作成本；

一些我們說的套殼產品，快速接入了各種模型和工具，但是他們各自為戰，用戶需要自己選擇對應的模型并且在傳統工具中進行復雜的剪輯工具；

最后是一些本質上是工作流的 Agent 產品，門檻變低了，但是內容制作的廣度和多樣性被犧牲了，普通用戶只能等待產品更新模板或者工作流，而且工作流的更新非常消耗人力。

Medeo 的選擇是：構建一套專門為視頻 Agent 創作的語言Gensystem，主要由三部分構成：

首先是 Medeo DSL：一套專門用來對視頻內容和制作方法進行表述的“視頻制作語言”可以將用戶的模糊自然語言指令轉換為模型可以理解的視頻編輯操作。
然后是 Context System：由工具集、視頻制作方式等信息構建的上下文系統，每次對話都可以從用戶的指令和需求中匹配更多的視頻制作專業上下文。
最后是 Environment：這是一個可以支持用戶與 AI 共同行動、控制編輯的視頻剪輯界面，我們前面說的混合編輯就是這個東西。

我前幾天說過，我寫Medeo提示詞有兩個原則：

1.盡可能的簡潔，少寫一些具體的需求
2.盡可能的通用，讓提示詞能支持更多的能力和更多的場景

但是，這兩個能促使我去實現這兩種寫法的，其實對于模型本身和整個Agent的系統有足夠高的要求。

這個系統必須能夠自己補充上下文，同時自己有一定的智能，無論是在圖像設計上的智能，還是在視頻剪輯以及視頻構建上的智能。

所以一個系統是否能支持這兩種寫法和原則，可以一定程度上判斷這個系統的上下文管理能力、上下文獲取能力以及智能程度。

很高興在視頻域證的領域有了一個這樣的產品，能夠讓我去搭建這樣的提示詞，能夠讓我去用一個提示詞來完成足夠多領域，或者足夠多能力的構建。

謝謝大家，今天的內容就到這里。

Medeo 目前還在內測，近期很快就會全量上線，如果你不是很著急，可以不用管邀請碼，他們發碼量也很大，我這里會抽 30 個，關注我的公眾號，在賬號內回復「Medeo」就可以獲取到激活碼抽獎小程序。

你也可以下面他們官號查看更多 Medeo 的官方的案例和使用指南，里面也會有官方發碼渠道。

也歡迎在評論區留下你的大作。如果有一些問題也可以問我，我會盡力回答。

如果覺得有幫助的話，可以幫我點個贊或者喜歡，也可以轉發??給你需要 Medeo 的朋友們，感謝。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.