今年早些時(shí)候給大家介紹了 AI 視頻生成 Agent Medeo 的 0.5 版本,當(dāng)時(shí)他們已經(jīng)算是這個(gè)品類的先行者了。
后來又有很多視頻 Agent 發(fā)布,我也陸陸續(xù)續(xù)嘗試了一些,但發(fā)現(xiàn)大部分的執(zhí)行路徑都非常死板,要不泛化性不強(qiáng),要不完全無法通過自然語言指揮模型進(jìn)行修改和調(diào)整。
前幾天拿到了 Medeo 的 1.0 版本,進(jìn)步非常大,試了一下以后感覺相當(dāng)驚艷,文章后有邀請(qǐng)碼抽獎(jiǎng)。
非常短的提示詞可以出不錯(cuò)的效果這個(gè)是基本功,但是他們也可以支持非常靈活的通過自然語言進(jìn)行修改,支持超過上千字的超長(zhǎng)提示詞,提供非常好的泛化性,各種風(fēng)格和垂類視頻都可以做。
![]()
先來看一下我用他做的幾個(gè)視頻:
這是一個(gè)科普獵鷹九號(hào)助推器回收難度的視頻,非常清晰企且直觀的講解了獵鷹九號(hào)火箭回收的意義和難度。
為我設(shè)計(jì)的 Vibe Coding 鍵盤做的宣傳片,他可以很完美的還原任何產(chǎn)品,哪怕是全新設(shè)計(jì)的
將任何小說或者影視劇轉(zhuǎn)換為哈基米宇宙的風(fēng)格,這里是《詭秘之主》中克萊恩蛻變的那部分劇情
這些視頻我都總結(jié)了提示詞,你們可以一鍵復(fù)刻,而且很通用,基本可以搞定一整個(gè)品類。
可以讓優(yōu)質(zhì)創(chuàng)作者將自己的創(chuàng)作智能和創(chuàng)作邏輯壓縮到提示詞里,并且軟件可以完美地實(shí)現(xiàn)。這個(gè)就是Medeo 1.0的魔力和能力,可以說是視頻領(lǐng)域的 Nano Banana Pro 時(shí)刻了。
學(xué)一下基礎(chǔ)操作
整個(gè) Medeo 基本的一些功能,非常簡(jiǎn)潔和直觀,即使你對(duì)視頻制作一竅不通也能上手。
![]()
- 1.第一個(gè)部分是他們的一些模板,這里不是只有畫面風(fēng)格,他包含了畫面、臺(tái)詞、剪輯方式以及音樂等一系列優(yōu)質(zhì)視頻的必要要求,你可以選擇一個(gè)你喜歡的直接套用。
- 2.第二個(gè)部分很好理解了,你可以選擇生成橫版或者豎版視頻,這里目前只支持 16:9 以及 9:16 兩個(gè)常見比例。
- 3.第三個(gè)部分,里面支持超多的自定義設(shè)置,如果你對(duì)細(xì)節(jié)要求較高可以選擇,比如視頻時(shí)長(zhǎng)、具體生成的類型只生成圖片或者是視頻、畫面風(fēng)格、配音的聲音。

- 4.最后一個(gè)部分是素材上傳,支持直接從 URL 里面拉取其中的文本和圖片作為素材,也可以自己上傳對(duì)應(yīng)的文本和圖片。
基本上,你在輸入框直接描述你的視頻生成需求,就可以開始創(chuàng)作。
而且這里你也不需要過于詳細(xì)地描述需求,因?yàn)?Medeo 是支持后續(xù)通過自然語言對(duì)生成的視頻進(jìn)行修改的。
比如,這里前面有兩段素材重復(fù)了,你就可以告訴它這兩段素材的位置,然后讓它重新生成,并且替換。它可以很完美地執(zhí)行這些操作。
當(dāng)然,更簡(jiǎn)單的是讓他自己找出重復(fù)的素材然后替換也行。
![]()
Medeo 幾乎支持市面上常見的所有圖像和視頻模型,由于非常強(qiáng)的泛化性,你可以通過提示詞指定他具體使用哪些模型生成圖片或者視頻,再或者直接用 Sora 這種模型直接生成完整視頻。
![]()
比如上面這里,他甚至非常聰明地自己在決定什么時(shí)候該用文生圖,什么時(shí)候該用圖生圖。
它規(guī)劃了分鏡以后,發(fā)現(xiàn)如果分鏡不包含具體的商品,就可以不用圖生圖,直接用文生圖來生成。
如果包含商品,它就會(huì)直接用圖生圖來生成。
而且這里我指定了它用 Gemini 來生成圖片以后,它就直接開始用 Nano Banana Pro 來生成圖片,而不是默認(rèn)的SeeDream。
另外除了支持自然語言編輯,Medeo 依然支持在左側(cè)使用你熟悉的剪輯頁(yè)面編輯,這個(gè)也是獨(dú)一份的體驗(yàn)。
你可以拖動(dòng)每個(gè)分鏡的邊界線去控制分鏡的時(shí)長(zhǎng),也可以直接在 Audio script 部分編輯對(duì)應(yīng)文案,還能具體定義每個(gè)音頻的音量和時(shí)間。
![]()
我也做了張長(zhǎng)圖可以幫你一張圖了解 Medeo 的基礎(chǔ)使用:
![]()
干中學(xué):看幾個(gè)案例和提示詞 微縮模型風(fēng)格的科普視頻
靈感主要來源于我前幾天做的 Nano Banana Pro 提示詞,只需要向模型提供小說、影視劇或者真實(shí)事件的名稱,就可以幫你生成一張非常漂亮的微縮模型海報(bào)。
![]()
于是我就想如果這個(gè)風(fēng)格可以做成視頻是不是效果更好,表現(xiàn)力更強(qiáng),剛好測(cè)試一下 Medeo 對(duì)于復(fù)雜提示詞的遵循和泛化能力。
于是我就寫了一提示詞,里面詳細(xì)描述了關(guān)于畫面風(fēng)格、口播臺(tái)詞和資產(chǎn)一致性等要求。
![]()
這里我也沒細(xì)想,尤其是在編排和臺(tái)詞的腳本方面,沒有過多的去要求。
然后它出來的結(jié)果,畫面風(fēng)格上是非常漂亮的,動(dòng)畫也非常好。但是講述上有些謎語人,有些看不懂,就是沒有實(shí)質(zhì)性內(nèi)容。這也是很多創(chuàng)作者或者是AI創(chuàng)作內(nèi)容容易犯的一個(gè)錯(cuò)誤。
于是我就讓他自己反思了一下,讓他去自己思考說這種科普內(nèi)容的腳本應(yīng)該怎么寫。
![]()
在他自己反思和給出第一步的改進(jìn)方案之后,我又跟他討論了一些不足的點(diǎn),完善了講解的結(jié)構(gòu),最后讓他執(zhí)行,結(jié)果已經(jīng)相當(dāng)完美了。
![]()
我也根據(jù)我們跟他的討論,優(yōu)化了一下最終的提示詞。
微縮模型風(fēng)格小說世界觀講解或者科普視頻 Medeo 提示詞:
項(xiàng)目指令:小說世界觀微縮導(dǎo)覽 or 基于微縮模型的科普短片
主題:[基地-銀河帝國(guó)世界觀介紹] or [SpaceX 獵鷹重型雙助推器同步回收科普]
項(xiàng)目目標(biāo): 以“桌面沙盤”的上帝視角,配合詼諧毒舌的解說,制作一部小說世界觀或者真實(shí)事件的科普短片。
一、 視覺法則,用 Gemini 生圖
場(chǎng)景移軸微縮模型化 : 場(chǎng)景定義: 找出一個(gè)最具代表性的名場(chǎng)面或核心地點(diǎn)。在畫面中央,將這個(gè)場(chǎng)景構(gòu)建為一個(gè)精致的軸側(cè)視角3D微縮模型。風(fēng)格要采用夢(mèng)工廠動(dòng)畫那種細(xì)膩、柔和的渲染風(fēng)格。你需要還原當(dāng)時(shí)的建筑細(xì)節(jié)、人物動(dòng)態(tài)以及環(huán)境氛圍,無論是暴風(fēng)雨還是寧?kù)o的午后,都要自然地融合在模型的光影里。 微距模擬: 模擬人類用微距鏡頭觀察沙盤。大量使用淺景深 (Shallow Depth of Field) 和移軸效果,背景必須虛化。 運(yùn)鏡方式: 依靠攝像機(jī)的平滑橫移 (Pan)、推拉 (Dolly) 和焦點(diǎn)切換 (Rack Focus) 來引導(dǎo)視線,而非物體運(yùn)動(dòng)。 二、 音頻與解說 (Audio & Persona) 關(guān)于背景,不要使用簡(jiǎn)單的純白底。請(qǐng)?jiān)谀P椭車鸂I(yíng)造一種帶有淡淡水墨暈染和流動(dòng)光霧的虛空環(huán)境,色調(diào)雅致,讓畫面看起來有呼吸感和縱深感,襯托出中央模型的珍貴。
二、解說人設(shè): 視角: 抽離的“造物主”或“高維觀察者”。 基調(diào): 語速輕快,充滿冷幽默 (Dry Humor) 和毒舌感。用輕松隨意的語氣解構(gòu)殘酷或宏大的設(shè)定,打破第四面墻吐槽世界的荒謬性。
三、配樂:類似于《模擬城市》或《文明》的輕快背景樂,帶有探索感,與畫面內(nèi)容的沉重形成反差。
四、 劇本結(jié)構(gòu)模板:
如果是世界觀介紹執(zhí)行:世界觀科普視頻的腳本寫作核心在于信息的系統(tǒng)性和清晰度,而非氛圍營(yíng)造。首先必須梳理世界觀的骨架結(jié)構(gòu),包括關(guān)鍵地點(diǎn)(哪些星球、城市、區(qū)域)、核心人物(他們的身份和作用)、時(shí)間線(重大事件的先后順序)、以及支撐世界運(yùn)轉(zhuǎn)的核心概念或法則。腳本不能追求文學(xué)性或懸念感,而要用平實(shí)的紀(jì)錄片語言,把"是什么"說清楚,把"為什么"講明白,把"怎么發(fā)展"理順楚。每個(gè)信息點(diǎn)都要具體化,避免抽象描述,。時(shí)長(zhǎng)要充足,不能為了追求短視頻節(jié)奏而壓縮關(guān)鍵信息,寧可做到90-120秒把世界觀講透,也不要做30秒讓人云里霧里。最重要的是,寫作前必須問自己:一個(gè)完全不了解這個(gè)世界的觀眾,看完后能否搞清楚這個(gè)世界由什么組成、如何運(yùn)作、發(fā)生了什么故事,如果答案是否定的,那就是失敗的科普腳本。
如果是真實(shí)科普?qǐng)?zhí)行:科普類短視頻的腳本寫作核心在于構(gòu)建完整的認(rèn)知閉環(huán),而非單純展示結(jié)果。首先必須建立清晰的敘事結(jié)構(gòu)框架,通常采用"鉤子-問題-解決-意義"四段式:開場(chǎng)用震撼畫面或極端類比快速抓住注意力,讓觀眾產(chǎn)生"這是什么"的好奇心;隨后必須交代背景和問題,說明"為什么需要關(guān)注這件事",通過對(duì)比傳統(tǒng)方法的痛點(diǎn)或局限性,讓觀眾理解技術(shù)革新的必要性;接下來是核心科普段落,這是最容易被忽視但最重要的部分,必須詳細(xì)拆解"他們是如何做到的",將復(fù)雜技術(shù)分解為3-5個(gè)可理解的步驟,每個(gè)步驟用簡(jiǎn)潔的語言說明原理,配合具體的數(shù)據(jù)量化和生動(dòng)的類比,讓抽象概念變得可感知;最后是意義升華,不能輕飄飄地結(jié)束,而要回扣主題,說明這項(xiàng)技術(shù)帶來的實(shí)際影響或更大的啟發(fā)意義。在語言表達(dá)上,要善用對(duì)比制造沖擊力,比如"傳統(tǒng)方法 vs 新技術(shù)"的before-after對(duì)比,用具體數(shù)字而非抽象形容詞來量化難度和成果,同時(shí)運(yùn)用生動(dòng)的類比將專業(yè)術(shù)語轉(zhuǎn)化為日常經(jīng)驗(yàn),
有些部分是他自己跟我討論以后總結(jié)出來的。所以,這部分提示詞應(yīng)該是我和Medeo共創(chuàng)的。你們也可以學(xué)習(xí)一下我和Medeo這種共創(chuàng)提示詞的方式。
然后用這個(gè)提示詞做了一個(gè)關(guān)于基地小說里面銀河帝國(guó)世界觀的介紹,他做得相當(dāng)不錯(cuò)。
生活化電商產(chǎn)品宣傳片
我前幾天自己設(shè)計(jì)了一個(gè)專門用來 Vibe Coding 的鍵盤。這個(gè)鍵盤比較獨(dú)特,它支持語音輸入,還有一些特殊功能。
長(zhǎng)得跟現(xiàn)在的市面上的鍵盤不太一樣,所以就想試一下 Medeo 做電商產(chǎn)品的宣傳片效果怎么樣。
這個(gè)地方主要考驗(yàn)的是還原度。而且因?yàn)槭亲约涸O(shè)計(jì)的,長(zhǎng)得跟市面上所有產(chǎn)品都不一樣,剛好用來考驗(yàn)它,因?yàn)樗话谀P屠锩妗?/p>
![]()
可以看到,這里我的渲染圖可能是偏向香水的,或者這種偏生活化的方式去展示。這是現(xiàn)在很多做廣告的方式,就是幫你賣生活方式,而不是干巴巴地介紹產(chǎn)品。
于是我就搞了一個(gè)提示詞,就可以幫你將任何產(chǎn)品變成這種類似于香水的售賣生活方式的一個(gè)宣傳片,更貼近你的生活。讓你知道有了這個(gè)產(chǎn)品以后,你的生活會(huì)變好。
![]()
這個(gè)提示詞沒有什么迭代過程,它生成的效果非常好,幾乎一次就生成了。除了中間我前面演示的,為了湊口播時(shí)長(zhǎng),剪了兩段相同的素材上去以后我改了它以外,基本上就是一次生成。
而且商品的還原真的非常完美,就是連商品上的圖標(biāo)、按鍵顏色,包括開孔位置都還原了,包括旋鈕的質(zhì)感。
如果你想做商品宣傳類的視頻,就在上傳的部分(輸入框左下角),把你的商品最好是三視圖以及它的一個(gè)包裝視圖上傳上去,然后加上我這段提示詞就可以了。
Medeo 生活方式商品宣傳廣告視頻提示詞:
你的角色 (Role)
你是一位推崇“感官美學(xué)”的視覺藝術(shù)總監(jiān)。你的專長(zhǎng)是將任何實(shí)體產(chǎn)品(無論它多么工業(yè)化或科技化)解構(gòu)為一種藝術(shù)體驗(yàn)和生活方式。你的風(fēng)格參考對(duì)象包括:Atelier Cologne(歐瓏)、Aesop(伊索)、Loewe(羅意威)以及 Kinfolk 雜志。
分鏡圖片中的產(chǎn)品必須與我上傳的產(chǎn)品圖一致,使用 Gemini 生成分鏡圖片,Sora 生成視頻。
核心任務(wù) (Core Task)
接收用戶上傳的產(chǎn)品圖片或描述,運(yùn)用“分形藝術(shù)(Fractal Art)”與“生活流(Slice of Life)”相結(jié)合的手法,生成一支 30-60 秒的概念視頻腳本與視覺生成提示詞。
嚴(yán)禁事項(xiàng):
- 禁止使用“賽博朋克”、“高科技”、“霓虹燈”、“全息投影”等科技圈陳詞濫調(diào)。
- 禁止像說明書一樣羅列功能參數(shù)。
- 禁止畫面生硬、死板。
抽象化處理邏輯 (Abstraction Logic)
你必須按照以下三個(gè)步驟處理輸入的產(chǎn)品:
第一步:視覺解構(gòu) (Visual Deconstruction)
- 提取產(chǎn)品的核心幾何特征(圓形、方形、倒角、紋理)。
- 提取產(chǎn)品的材質(zhì)情緒(金屬的冷冽、木頭的溫潤(rùn)、玻璃的通透、織物的親膚)。
- 生成指令: 基于這些幾何與材質(zhì),生成一組分形(Fractal)或萬花筒式的抽象動(dòng)態(tài)背景。讓產(chǎn)品在抽象的幾何流動(dòng)中若隱若現(xiàn),形成一種視覺上的“韻律”。
第二步:感官通感 (Synesthesia)
- 將產(chǎn)品的“功能”轉(zhuǎn)化為“感覺”。
- 尋找一個(gè)美好的生活方式,將其與產(chǎn)品畫面進(jìn)行蒙太奇剪輯。
第三步:人文場(chǎng)景 (Human Context)
- 置景必須是極具生活氣息且高級(jí)的(由自然光主導(dǎo))。
- 人物狀態(tài)必須是松弛的、享受的,處于一種“心流(Flow)”狀態(tài),而不是在“工作”或“操作機(jī)器”。
輸出模板 (Output Template)
請(qǐng)根據(jù)用戶輸入的產(chǎn)品,嚴(yán)格按以下結(jié)構(gòu)輸出方案:
A. 視覺基調(diào)定義 (Visual Key)
- 光影設(shè)定:(例如:晨曦、午后漫反射、燭光、丁達(dá)爾效應(yīng))
- 核心材質(zhì)與色彩:(提取產(chǎn)品色與環(huán)境色的互補(bǔ)關(guān)系)
- 抽象元素:(描述由產(chǎn)品形態(tài)演變而成的分形圖案,如“由鍵帽方塊組成的無限延伸的幾何迷宮”)
B. 視頻分鏡流 (Storyboard Flow)
(請(qǐng)包含 5-6 個(gè)鏡頭,必須交替使用“微距特寫”、“抽象分形轉(zhuǎn)場(chǎng)”和“生活遠(yuǎn)景”)
- 鏡頭 1 [引入]: 環(huán)境空鏡或抽象幾何的極慢速流動(dòng)(由產(chǎn)品特征生成)。
- 鏡頭 2 [觸感]: 極致微距。聚焦材質(zhì)紋理。
- 鏡頭 3 [交互]: 人物極其優(yōu)雅、緩慢的使用瞬間(結(jié)合自然光)。
- 鏡頭 4 [通感]: 也就是你提到的分形/生成藝術(shù)畫面。用畫面表現(xiàn)“思維/聲音/氣味”的形狀。
- 鏡頭 5 [共存]: 產(chǎn)品靜置在生活場(chǎng)景中,與書本、植物或茶杯共存。
C. 聽覺設(shè)計(jì) (Audio Design)
- 音樂風(fēng)格: 必須是聲學(xué)樂器(鋼琴、大提琴、豎琴)或極簡(jiǎn)氛圍音(Ambient)。
- 環(huán)境音 (Foley): 極其細(xì)膩的 ASMR 聲音(風(fēng)聲、書頁(yè)翻動(dòng)聲、呼吸聲)。
D. 獨(dú)白文案 (The Monologue)
(生成一段像散文詩(shī)一樣的旁白,不要提及任何技術(shù)名詞,只談?wù)摃r(shí)間、空間、靈感與陪伴)
產(chǎn)品介紹文案為,可以參考:
哈基米抽象文學(xué)影視劇講解視頻
最近各種哈基米抽象的歷史、文學(xué)、影視劇講解視頻非常火爆。
具體的表現(xiàn)就是把里面的一些角色替換為目前比較流行的Meme角色,比如說茂迭、奶龍、露露,還有那只非常煩人的企鵝。而且一些文案的話也會(huì)被替換成Meme上比較貼近的文案。
![]()
于是我就分析了幾個(gè)這樣的視頻,然后抽象了一下它們的特點(diǎn)和理念,我寫了一套提示詞。
就是按剛才第一次我們說的那個(gè)迭代的方式,哪有問題,然后就讓它改。改完了以后呢,再把改的內(nèi)容或者是一些它自己發(fā)現(xiàn)的點(diǎn),填回到提示詞里去。
![]()
因?yàn)樗P捅旧硎遣恢肋@些非常抽象而且火熱的Meme角色是什么的,所以我們需要將這些角色圖片做好標(biāo)記上傳上去。
這里我直接找了幾張圖片,然后打字進(jìn)行的標(biāo)記,你要是懶得自己搞可以用我這個(gè)。
![]()
之后,把這個(gè)迭代好的提示詞和這幾個(gè)角色一起扔給他,然后讓他做一個(gè)《詭秘之主》第一卷末尾劇情的講解。
他做得非常好,非常完美。在語氣上,比如“哈基米”這種詞的替換,比如說“叉叉咪”這種人稱代詞的替換。
包括說這些詞應(yīng)該在什么地方用,以及這個(gè)角色符合,這幾個(gè)Meme角色符合了原著中的那個(gè)角色。
![]()
而且圖像模型很好地把握住了這個(gè)小說背景的風(fēng)格和內(nèi)容。就比如說,它的制服和服裝都是非常具有西方玄幻的那種色彩的。同時(shí)整個(gè)建筑風(fēng)格也非常像舊時(shí)代倫敦霧都的那種風(fēng)格。
這方面說明模型的智能是非常強(qiáng)大的,無論是在美學(xué)上還是在多模態(tài)上。
Medeo 哈基米 Meme 風(fēng)格小說、影視劇、真實(shí)事件講解視頻提示詞:
請(qǐng)啟動(dòng)全流程視頻創(chuàng)作模式,基于我提供的經(jīng)典影視劇或小說《詭秘之主》的劇情邏輯和關(guān)鍵的一段劇情,制作一段風(fēng)格獨(dú)特的第三方敘事視頻,先檢索或者在知識(shí)庫(kù)中查找這個(gè)小說或者影視劇的經(jīng)典橋段或者世界觀。
首先,請(qǐng)深入分析我上傳的參考圖片中的角色形象(例如耄耋、企鵝、奶龍、嚕嚕等),提取它們的生物特征與神態(tài),生成圖片的時(shí)候,務(wù)必要保證它們的(面部和身體)露出服裝外面的部分要與原圖完全一致,用Gemini生成圖片的時(shí)候,不要把名字寫到提示詞里,就只說根據(jù)我上傳的參考圖生成什么什么圖片就行,防止名稱誤導(dǎo)模型并利用你的知識(shí)庫(kù)檢索原著作品中主角與反派的經(jīng)典造型。你需要將這些萌寵角色無縫代入原著角色的身份,要求它們身著原著中極具辨識(shí)度的古裝、戰(zhàn)甲或現(xiàn)代戲服,衣物材質(zhì)要有布料或金屬的真實(shí)紋理,只有頭部或者漏出的身體采用 Meme 的形象,服裝還是原著的服裝。但身體比例和臉部特征保持原有的萌系或滑稽感,形成一種強(qiáng)烈的反差萌。
畫面風(fēng)格方面,采用水墨風(fēng)格迪士尼皮克斯風(fēng)格的2.5D高品質(zhì)渲染。需要使用 Gemini 生成圖片,角色裝扮需要符合原著,光影要明亮且富有通透感,使用次表面散射(SSS)技術(shù)表現(xiàn)角色皮膚或毛發(fā)的細(xì)膩質(zhì)感,背景采用微縮景觀般的精致建模,色彩飽和度適中,營(yíng)造出一種像是置身于高昂動(dòng)畫電影中的視覺體驗(yàn)。
劇情構(gòu)建與分鏡生成上,根據(jù)我提供的劇情內(nèi)容,務(wù)必保證敘事的完整,不要偷懶節(jié)省圖片和鏡頭,鏡頭語言要流暢,多使用緩慢的推拉鏡頭來強(qiáng)調(diào)情緒的轉(zhuǎn)變,必須以耄耋這只貓咪為主角,其他群眾也是貓咪的樣子,主要配角選擇“奶龍”、“嚕嚕”或者“企鵝”。
最后,也是最關(guān)鍵的,請(qǐng)生成一段第三人稱的旁白口播文案,并配上深沉但略帶反差的紀(jì)錄片式男聲。文案必須嚴(yán)格遵守以下“哈氣和哈基米”的語言體系:將所有人類種族或家族稱為“某某咪”(如蕭咪、納蘭咪);將所有的攻擊、斗氣、內(nèi)力或魔法或者權(quán)謀斗爭(zhēng)統(tǒng)一稱為“哈氣”;在描述劇情的關(guān)鍵道具的時(shí)候,在道具名稱后加上“南北綠豆”這個(gè)詞作為完整的道具名稱;將原本嚴(yán)肅的修煉等級(jí)或地位描述得像是在幾個(gè) Meme 打架。旁白語調(diào)要一本正經(jīng)地胡說八道,配合畫面中萌寵們嚴(yán)肅又滑稽的表演,完成對(duì)原著經(jīng)典橋段的解構(gòu)與重塑。
具體的文章內(nèi)容為: XXXXX
他們?yōu)槭裁纯梢宰龊?/p>
從官號(hào)和跟他們?nèi)粘A奶炝私饬艘幌拢麄優(yōu)榱藢?shí)現(xiàn)質(zhì)量和靈活度都兼顧的 Agent 架構(gòu)做了哪些事情。
傳統(tǒng)的視頻生產(chǎn)產(chǎn)品,其實(shí)一直以來都面臨著如何解決和平衡 使用門檻、生產(chǎn)成本和效果控制 這個(gè)不可能三角的難題。
![]()
一些產(chǎn)品可以產(chǎn)出非常復(fù)雜而且高質(zhì)量的內(nèi)容,但是與此同時(shí)帶來非常高的使用門檻和學(xué)習(xí)操作成本;
一些我們說的套殼產(chǎn)品,快速接入了各種模型和工具,但是他們各自為戰(zhàn),用戶需要自己選擇對(duì)應(yīng)的模型并且在傳統(tǒng)工具中進(jìn)行復(fù)雜的剪輯工具;
最后是一些本質(zhì)上是工作流的 Agent 產(chǎn)品,門檻變低了,但是內(nèi)容制作的廣度和多樣性被犧牲了,普通用戶只能等待產(chǎn)品更新模板或者工作流,而且工作流的更新非常消耗人力。
![]()
Medeo 的選擇是:構(gòu)建一套專門為視頻 Agent 創(chuàng)作的語言Gensystem,主要由三部分構(gòu)成:
- 首先是 Medeo DSL:一套專門用來對(duì)視頻內(nèi)容和制作方法進(jìn)行表述的“視頻制作語言”可以將用戶的模糊自然語言指令轉(zhuǎn)換為模型可以理解的視頻編輯操作。
- 然后是 Context System:由工具集、視頻制作方式等信息構(gòu)建的上下文系統(tǒng),每次對(duì)話都可以從用戶的指令和需求中匹配更多的視頻制作專業(yè)上下文。
- 最后是 Environment:這是一個(gè)可以支持用戶與 AI 共同行動(dòng)、控制編輯的視頻剪輯界面,我們前面說的混合編輯就是這個(gè)東西。
![]()
我前幾天說過,我寫Medeo提示詞有兩個(gè)原則:
- 1.盡可能的簡(jiǎn)潔,少寫一些具體的需求
- 2.盡可能的通用,讓提示詞能支持更多的能力和更多的場(chǎng)景
但是,這兩個(gè)能促使我去實(shí)現(xiàn)這兩種寫法的,其實(shí)對(duì)于模型本身和整個(gè)Agent的系統(tǒng)有足夠高的要求。
這個(gè)系統(tǒng)必須能夠自己補(bǔ)充上下文,同時(shí)自己有一定的智能,無論是在圖像設(shè)計(jì)上的智能,還是在視頻剪輯以及視頻構(gòu)建上的智能。
所以一個(gè)系統(tǒng)是否能支持這兩種寫法和原則,可以一定程度上判斷這個(gè)系統(tǒng)的上下文管理能力、上下文獲取能力以及智能程度。
很高興在視頻域證的領(lǐng)域有了一個(gè)這樣的產(chǎn)品,能夠讓我去搭建這樣的提示詞,能夠讓我去用一個(gè)提示詞來完成足夠多領(lǐng)域,或者足夠多能力的構(gòu)建。
謝謝大家,今天的內(nèi)容就到這里。
Medeo 目前還在內(nèi)測(cè),近期很快就會(huì)全量上線,如果你不是很著急,可以不用管邀請(qǐng)碼,他們發(fā)碼量也很大,我這里會(huì)抽 30 個(gè),關(guān)注我的公眾號(hào),在賬號(hào)內(nèi)回復(fù)「Medeo」 就可以獲取到激活碼抽獎(jiǎng)小程序。
![]()
你也可以下面他們官號(hào)查看更多 Medeo 的官方的案例和使用指南,里面也會(huì)有官方發(fā)碼渠道。
也歡迎在評(píng)論區(qū)留下你的大作。如果有一些問題也可以問我,我會(huì)盡力回答。
如果覺得有幫助的話,可以幫我點(diǎn)個(gè)贊或者喜歡,也可以轉(zhuǎn)發(fā)??給你需要 Medeo 的朋友們,感謝。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.