![]()
一個有著超大“內(nèi)存”的智能助手,可以一口氣讀完二十萬字的小說,還會上網(wǎng)沖浪,這是一款名為Kimi的AI助手的官方介紹。
如果是作為一位電子文檔和生成式AI高頻使用者,你在此之前可能未必聽說過這款助手;但如果你是一個A股的資深股民,你一定在這幾天內(nèi)聽說過這個名字。
兩周之前,國內(nèi)AI獨角獸月之暗面宣布其對話式AI助手產(chǎn)品Kimi智能助手現(xiàn)已支持200萬字的無損上下文輸入。
![]()
但AI界還沒有反應(yīng)過來的時候,資本市場的狂歡突然之間開始了。首先開始大漲的,居然是昔日A股“妖王”九安醫(yī)療。自3月19日起,九安醫(yī)療股價起飛。從當(dāng)日開盤41.96元/股,在4個交易日內(nèi)一度漲至最高54.98元/股。這是因為在2023年8月時,九安醫(yī)療曾經(jīng)投資過月之暗面這家公司。
但事情發(fā)展的速度太快,隨后幾天里,A股市場上冉冉升起了一個全新的概念——“kimi概念股”,并且多家上市公司股價因此而受益。
![]()
圖片來源:邏輯挖掘社
比如華策影視擁有國內(nèi)影視行業(yè)最大的全版權(quán)片庫,掌閱科技接入Kimi嘗試打造智能閱讀App,中文在線擁有可用于模型的IP數(shù)據(jù),中廣天擇為其提供數(shù)據(jù)支持和交易平臺,深信服參與了月之暗面的融資。值得注意的是,就連人民網(wǎng)都是Kimi內(nèi)容合規(guī)的核心合作方和訓(xùn)練數(shù)據(jù)審核方……
而如上列舉的,僅僅也只是一眾Kimi概念股中的一部分。一周時間里,沉寂已久的A股市場上迎來了一場久違的概念股炒作狂歡,其爆火的熱度,以至于讓一眾互聯(lián)網(wǎng)大廠們都坐不住了,相繼開始布局kimi所在的長文本賽道。
不過,從這一周開始,Kimi概念股就開始相繼熄火,比如此前漲幅不錯的九安醫(yī)療和華策影視,股價都開始掉頭向下,華策影視一度跌超9%。
這場關(guān)于AI的炒作盛宴,還沒正式開始,似乎就要結(jié)束了。
到底發(fā)生了什么?
01
Kimi的爆火,從最開始就透露出了一股迷之氣息——因為它所主打的長文本賽道,本身并不算是什么新的技術(shù)路線。甚至在Sora推出之前,單一的大語言模型就被認(rèn)為遲早是要轉(zhuǎn)向多模態(tài)的。
也正因為是這樣,Kimi的爆火就仿佛是,進入IOS時代之后,一款塞班系統(tǒng)的機器突然被認(rèn)為是國產(chǎn)手機之光。
當(dāng)然,Kimi也并非沒有優(yōu)點。比如和其他文生文大模型應(yīng)用相比,Kimi 這款產(chǎn)品自誕生起的核心競爭力就在于長文本分析聯(lián)網(wǎng)搜索、文檔處理等功能。特別是在深度解析厚重書籍內(nèi)容方面,其性能遠超其他模型。
有人實測了Kimi在長文本閱讀上的表現(xiàn),發(fā)現(xiàn)其在理解超長文本,比如小說和長篇文件上確實具有獨到優(yōu)勢。輸入一本《紅樓夢》,數(shù)秒內(nèi)就能給你一篇漂亮的總結(jié)報告。但是,目前市面上的主流大模型產(chǎn)品在promot的輸入上都是有字?jǐn)?shù)限制的。
比如GPT-3.5上下文輸入長度約在1.6萬token,GPT-4在3.2萬token(token:模型輸入和輸出的基本單位)。把token量化成人類語言的話,3.2萬token的GPT-4達到了閱讀一篇短篇小說的程度,但并不支持閱讀長篇小說。
在理解長篇著作這一點上,Kimi確實有強大優(yōu)勢。
而且,對于中國市場的理解,要完爆OpenAI的ChatGPT好幾條大街。比如,向kimi提問“構(gòu)建房地產(chǎn)市場新發(fā)展模式”最早是在哪份文件中提出的,kimi能夠以極快的速度給出正確答案,這也是ChatGPT和Gemini們一輩子難以企及的覺悟。但問題是,這個優(yōu)點其他國產(chǎn)大模型也有。
因此,市場對于Kimi的商業(yè)模式價值判斷主要還是集中在第一點——長文本上。
![]()
但從技術(shù)上來看,作為文生文模型上的衍生,長文本在技術(shù)上并沒有太多的實現(xiàn)難度。無非是加大算力支撐。但也正因為這樣,長文本在現(xiàn)實中會遇到一個致命bug,就是成本和收益是否匹配。
一般來說,增加模型規(guī)模可能會提高模型的性能,如語言理解能力、生成文本的質(zhì)量等。更大的上下文范圍可以提供更多信息來輔助模型做出更準(zhǔn)確的預(yù)測或生成更自然的文本。
這本身并沒有什么技術(shù)門檻,但隨著模型規(guī)模的增加,需要更多的計算資源來訓(xùn)練和運行這些模型。這可能包括更多的GPU/TPU資源以及更長的訓(xùn)練時間。因此,在考慮模型規(guī)模時,需要權(quán)衡性能提升和資源成本之間的關(guān)系。
去年10月,月之暗面創(chuàng)始人楊植麟去年向行業(yè)媒體稱,不同于OpenAI只提供ChatGPT一個產(chǎn)品和最先進的多模態(tài)基礎(chǔ)能力,月之暗面瞄準(zhǔn)的是下一個C端超級APP:以長文本技術(shù)為突破,在其基礎(chǔ)通用模型基礎(chǔ)上去裂變出N個應(yīng)用。
02
換句話說,Kimi打一開始就是沖著商業(yè)化變現(xiàn)轉(zhuǎn)化去的。這又是一個典型的中國AI產(chǎn)品特點。當(dāng)然這并不是壞事,畢竟不是誰都能有微軟投入OpenAI的冒險和決心的。
但問題是,月之暗面所設(shè)想的C端,到底有多少人存在長文本解析的需求?除了學(xué)術(shù)研究需要,起碼從目前來判斷,看不到什么更大的場景。
更關(guān)鍵的是,只看見了出項,卻沒有看到進項。
據(jù)七麥數(shù)據(jù)下載量預(yù)估,近一個月來,Kimi 在App Store日均下載量5445,在安卓端全渠道日均下載量12360,合計日均下載量為17805。目前Kimi投放廣告的獲客成本約在10元,如果算上拉新后用戶問答互動產(chǎn)生的算力成本,每個用戶的獲客成本達到12-13元。根據(jù)第三方平臺的下載量預(yù)估,近一個月來,Kimi在蘋果端和安卓端的日均下載量為17805。按此計算,Kimi每天的獲客成本將燒掉至少20萬元。
不論金額多少,這個數(shù)據(jù)本身就充滿了吊詭和荒誕。因為你基本很少看見關(guān)于ChatGPT和Gemini的討論是聚焦在他們的獲客成本上的。相反,ChatGPT自誕生之后,就成為史上最快用戶破億的消費級應(yīng)用。
也就是說,當(dāng)國外的大模型已經(jīng)正在思考技術(shù)變革是否會威脅人類時,我們的大模型目標(biāo)是如何抓取更多的人類注意力。
商業(yè)模式之外,技術(shù)也并非完全沒有門檻存在。考慮長文檔規(guī)模大小的時候還需要看智能水平,目前包括GPT-4、Gemini、Claude等模型均未達到理想水平。另外,長文檔規(guī)模與智能水平也需要進行工程方面的ROI考量。這些都在技術(shù)上還存在需要克服的門檻。
當(dāng)然,這并不是否認(rèn)kimi母公司月之暗面的能力。從創(chuàng)始團隊背景來看,公司創(chuàng)始人楊植麟為中國35歲以下NLP領(lǐng)域引用最高的研究者,Transformer-XL和XLNet兩篇論文的第一作者,公司另外兩位聯(lián)合創(chuàng)始人周昕宇和吳育昕也在大模型道路上探索多年。
![]()
由此也可見,技術(shù)基本盤還是有的。但是如果對比目前國內(nèi)大模型賽道上的創(chuàng)業(yè)團隊來看,每一家其實都不會太差。除了一眾互聯(lián)網(wǎng)大廠,百川智能、智譜AI等從創(chuàng)始人到團隊,背景都不會輸給月之暗面。
但為什么,目前只有Kimi在Sora的強大光環(huán)之下還算是“出圈”了呢?
上面問題的答案,可能并不在月之暗面公司本身。
![]()
03
眾所周知,自2023年開始,中國市場就掀起了轟轟烈烈的百模大戰(zhàn)。
自從2022年12月ChatGPT-3.5的發(fā)布之后,生成式AI的技術(shù)革命浪潮就已經(jīng)開啟。2023年2月開始,中國國內(nèi)就涌現(xiàn)出眾多的通用大模型和垂類大模型,目前國內(nèi)公布的大模型數(shù)量已超過300個,市場競爭極度激烈,其中不乏也存在著號稱要在幾個月追平ChatGPT的選手。
過去四十年來,中國企業(yè)的競爭方式一直是追趕、復(fù)制、模仿。然而,到了2024年開年,OpenAI新發(fā)布的Sora震驚四座卻在中國市場應(yīng)者寥寥。這一次,辛苦追趕一年的各路大模型們猛然發(fā)現(xiàn),曾經(jīng)以為中美的AI差距也就是幾個月時間,但在OpenAI的顛覆式創(chuàng)新面前,差距比想象的要大得多。
但市場情緒總需要找到一個標(biāo)的——Kimi恰好搭上了這班流量和情緒的高速列車。本質(zhì)上,市場并不在乎它到底是Kimi還是別的什么,也不關(guān)心這家公司是不是存在顛覆式創(chuàng)新,只在乎我是不是能通過AI概念的炒作,來收割韭菜。
目前來看,中國的大模型究竟能不能跑出可與OpenAI叫板的選手還是一個巨大的未知數(shù)。我只知道,去年6月我在和OpenAI的一位知名科學(xué)家聊起中國市場正在進行的“百模大戰(zhàn)”時,他所表現(xiàn)的茫然和尷尬,最后不得已回我一句——
我們并沒有注意到中國AI產(chǎn)業(yè)的這些變化。但我想真正的標(biāo)準(zhǔn)還是需要評估它的創(chuàng)新程度,而不是追逐創(chuàng)新的能力。
We'd want to evaluate the extent to which they are either cutting edge or innovative, as opposed to simply chasing the cutting edge.
當(dāng)然,還是非常期待看到借助A股市場力量的Kimi,到底能在互聯(lián)網(wǎng)大廠、李開復(fù)、王小川等人至今也未能取得突破性進展的賽道上取得怎么樣的創(chuàng)新。
畢竟,目前中國AI產(chǎn)業(yè)還有一大后發(fā)優(yōu)勢——馬斯克前段時間選擇給旗下的生成式AI開源,中國AI又一次獲得了追趕和學(xué)習(xí)的機會。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.