ONE2X 正式發布了 Medeo 1.0,很易上手
https://www.medeo.app/
ONE2X 剛完成A輪,累計融資額近2300 萬美元
資方包括清流、九合、聯想,老股東美團龍珠和小米王川繼續跟投,更早的投資方還有紅杉中國和百川
團隊約 30 人,核心成員來自月之暗面、字節、阿里、快手
晨然是 Medeo 的產品負責人,是最典型的 AI 產品經理樣本:懂技術、善于思考、既了解模型的脾氣,又明白創作者的痛苦
他之前是全棧工程師,剪視頻剪了 8 年,做過 B 站 UP 主,上傳過六七十個視頻,從編劇、導演到剪輯全流程都干過
去年 7 月的時候,晨然跟我說他加入了一個視頻工具創業公司,希望能創造點與眾不同的東西
當時沒太當回事,但直到前段時間才知道他去了 ONE2X 做 Medeo
優秀的人,總是可以與優秀的團隊,一拍即合
![]()
ONE2X 的創始人王冠,則更是有趣
是月之暗面前模型產品負責人,也是月之暗面第一個離職創業的人
ONE2X 的由來
在加入月之暗面之前,王冠嘗試過三次創業方向,每一次都精準地踩在了 OpenAI 的更新路徑上
? 第一次,
做寫作輔助工具,剛跑通 Demo,ChatGPT 發布了? 第二次,
做「Excel 轉圖表」的代碼生成工具,剛看到效果,GPT-4 發布了,自帶 Code Interpreter,直接覆蓋? 第三次,
做 Agent 工作流,剛準備融資上會,OpenAI Plugins 發布了,思路完全撞車
這讓他意識到一個問題
如果不理解模型能力到底是怎么來的,未來會朝什么方向發展,你做的事情和模型的關系是什么,那就是在一個非常虛無的地基上構建想法
于是,他去了月之暗面,待了一年,搞清楚幾件事之后出來創業
他的結論指向一個詞:數據
王冠把 AI 行業的發展分成三個階段:
?第一階段,拼公域數據:誰能更快清洗互聯網公開數據,這個階段已經過去,格局已定;
?第二階段,拼領域數據:「我有你沒有」的行業私有數據,這利好大廠;
?第三階段,拼內生數據:「之前世界上不存在的數據」
在 ChatGPT 出現前,沒有通過對話方式解決各種問題的海量自然語言數據。這份數據是因為有了 ChatGPT 這個產品形態,才慢慢產生的
只有通過設計新的產品形態產生內生數據,應用層公司才能建立壁壘
這是王冠選擇做視頻的底層邏輯之一
視頻是價值更高的模態,在美國市場,有 20-30 家做視頻處理的 SaaS 產品,ARR 都能做到幾千萬美金
「一鍵生成」的問題
Medeo 的定位是「全品類對話式 AI 視頻創作工具」
用對話做視頻,而非一鍵生成視頻
今年 5 月,Medeo 發布了早期測試版本
同期的競品不少,納米 AI 做得最早,小云雀、360 也在做類似的事
![]()
到了 10 月,這些聲音基本都沒了信息插播:國慶之初,Sora2 發布
晨然復盤過這件事。他的結論是:剪輯和創作絕對不是線性的過程,是一個反復迭代的過程
「一鍵生成」的問題在于,它剝奪了用戶迭代和修改的權利。一鍵出的視頻不夠好,用戶想改又改不了,這就成了死局
如果一鍵真能出好視頻,廠商應該直接生產內容去賣,而不是做工具
![]()
在目前階段,一鍵生成還未走通
還有一個例子。有些競品做了「畫分鏡」的功能,用戶嘴上都夸好用,但實際上數據很難看,根本沒人用
分鏡只是傳統流程中階段性的產物,創作者真正關心的是最終效果。Sora-2 出來之后可以直接繞過分鏡出更好的視頻,內置了多分鏡能力,對「先確定分鏡再做視頻」的工作流是降維打擊
![]()
類似虛榮指標,或許還可以有「虛榮功能」
Medeo 早期版本其實是一個半成品態,生成系統還沒完全搭建好。這次 1.0 版本,是把生成系統的架構搭建完成了,可以支持對話式連續創作、語義化 Workflow 的使用方式
這個形態參考了 Cursor
為什么是 Cursor
這里有個挺微妙的發現
晨然在做 Prompt Engineering 和 Context Engineering 的時候注意到:
目前主流的大模型,訓練數據里高質量的邏輯部分,很大比例來自于 Coding 場景
這事兒就顯得非常有趣:
在調試 Prompt 的時候,越對齊它的訓練數據范式,模型就越聽得懂
他試過用視頻行業的術語去寫 Prompt,效果很差
但用類似代碼的邏輯,效果瞬間提升
非常有趣
要想讓 AI 聽得更懂,可以先把任務,偽裝成寫代碼
![]()
這...讓我想到了繼剛提示詞
Cursor 還有一個值得借鑒的,是及時反饋
Agent 如果 3 秒內沒給反應,用戶就會慌
在這里,Cursor 的交互做得最好
![]()
Cursor 和視頻生成,隔空互動了
視頻和代碼最大的區別,是Validation
代碼寫錯了, IDE 會報錯
但視頻創作沒有「錯誤」,它是風格化的,允許幻覺
視頻沒有語法報錯,只有好不好看
![]()
這意味著 Medeo 沒法像寫代碼那樣做自動化測試,得自己造「負反饋鏈路」
通過 AI 視覺模型去給用戶「報錯」或「提示」
![]()
這也呼應了王冠的產品架構思路,他把生成系統分成三層:
? 底層是 DSL(領域特定語言),定義了視頻制作的原子操作;
? 中間層是 Context 系統,負責把用戶模糊的意圖轉化為精確的指令;
? 頂層是 Environment,讓人和 AI 在里面共同活動
「Context is Everything」,王冠反復強調這句話
![]()
基座模型大家用的都一樣,產品的優劣完全取決于你在模型之外構建的上下文
Medeo 工具
你在對話框里告訴 Medeo 你想做什么,它會幫你寫腳本、拆分場景、規劃節奏,然后自動匹配媒體素材、語音音色、背景音樂,最后把所有東西編排到時間軸上
![]()
Medeo 產品界面,非常清晰、易用
三種玩法:
語義化工作流
用自然語言告訴 Medeo 你想如何制作視頻,包括視頻是什么樣、按什么步驟制作、每一步需要什么工具。比如「用圖生圖確保人物一致性生成分鏡,最后用 Sora-2 圖生視頻,然后配英文的解說」。Medeo 能直接響應你的方法,按要求執行
智能體模式
只描述你對視頻的想法,讓 AI 自由決策該如何制作。適合不想操心技術細節的人
對話模式
從一個 idea 出發,通過不斷對話,明確和完善想法以及視頻內容。可以先說「你好」,然后慢慢聊出一個完整的視頻
這里,核心差異點在于「雙重控制」:既有 AI 對話式修改的便捷,又保留軌道編輯的手動精修能力。交付的是可編輯的剪輯工程文件,不是死的視頻
![]()
目前支持的模型包括: Doubao、Gemini、Midjourney、 Minimax 和 Sora-2
生成的品類,也是全支持:動畫、漫劇、科普視頻、教程、MV、廣告,都能做
批發商 vs 零售商
我問晨然
“Medeo 和可靈、Sora 什么關系?未來模型能力越來越強,會不會把應用層覆蓋掉?”
回答很直接
他們是供應商(批發商),我們是零售商(加工商)
模型廠是在超市賣礦泉水的,一瓶賣 2 塊錢
應用層是在 KTV 里賣礦泉水的,可以賣 20 塊
![]()
應用層,通過場景服務來溢價
Sora 出來的時候,晨然說他也慌過,但體驗后發現,它解決不了「靈感」和「敘事邏輯」的問題
素材越好,對剪輯和敘事的要求就越高
王冠有一個說法:視頻可以分成兩個世界。物理世界的視頻,攝像頭拍攝的,對應短視頻生態,供給已經非常充分;理念世界的視頻,AI 生成的,對應知識、藝術、精神信仰類內容,以前因為制作成本過高而稀缺
他把前者比作「夜店、生活廣場、超市」,把后者比作「圖書館、歌劇院、大教堂」
ONE2X 的目標是后者
![]()
快手在今年 8 月發布的二季度財報中稱,可靈 AI 的單季收入已超過 2.5 億美元。Runway 在 6 月宣布年化營收超過 9000 萬美元
市場是存在的。問題是誰能吃到應用層的溢價
一個 Remote Native 的組織
ONE2X 的組織形式也值得聊聊
從公司建立第一天開始,就決定以 Remote Native 的形式存在。沒有管理崗,甚至不考勤
王冠把建立組織類比為強化學習中「搭建環境」的過程
每個員工都是獨立的智能體
組織的任務不是去控制員工,而是搭建一個環境,讓智能體在其中自主活動
Demo 先行
現在這個版本在 7、8 月份的時候就已經做出來了一個非常接近的 Demo,一兩周時間就可以測試可行性
團隊內認知閉環
Cursor 做得好,是因為團隊本身就是自己產品的用戶。程序員、懂 AI 的人,每天高強度使用 Cursor,每個人既是生產者也是消費者,非常清楚自己做的產品到底哪里不好
![]()
ONE2X 組織方法論
但 AI 加視頻比 AI 加 Coding 難一點。AI 加 Coding 很容易在一個人身上完成閉環,但 AI 加視頻,需要既懂 AI 又懂內容的人。如果反饋鏈路放得太遠,迭代速度就會變慢
所以 ONE2X 的做法是:
既然要做創作工具,團隊本身就得成為創作者
所以,ONE2X 招了很多真正懂內容的人,電影系的、影視行業的編劇,讓他們反復使用 Demo,更快速地積累產品還有哪些問題
創作者智慧才是壁壘
Medeo 發現很多用戶是 Prosumer(專業消費者/半專業人士)
有個編劇,把自己幾萬字的短劇寫作指南喂給 AI,跑通了一個非常牛的工作流。他甚至覺得手動搞比用產品要好
到了 Medeo 中,他可以把這套手動流程用自然語言表述的方式「縫」進產品里
這給了團隊啟發:下一個階段的產品,其實是圍繞「創作者智慧」進行服務
![]()
域民不以封疆之界,固國不以山溪之險
工具隨時可以被替代。但如果用戶的 Prompt 習慣、項目 Context、Workflow 都沉淀在你這,產品才能成為真正的創作伙伴
所以 Medeo 現在做的很多功能,比如統一腳本格式、世界觀設定卡、人物小傳,本質上都是為了幫助創作者固化這些「獨有智慧」
王冠表示:未來的創作者會兩極分化,金字塔尖的藝術家/專家,他們控制的不是生產內容的能力,而是控制生產能力如何被使用的邏輯,不同創作者之間的壁壘在于 Recipe(配方)和 Taste(品味)
作為平臺,不僅要提供錘子,還要幫用戶把敲打手法存下來
最后
現在看到的 AI 應用,很像諾基亞手機上的計算器或貪吃蛇
作為創業者,在真正的「iPhone 時刻」到來之前,可以通過各種方式貼身的感知模型變化,積累數據和 Context,為未來做準備
一切都在成長,一些事情值得記錄
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.