![]()
智東西
作者 李水青
編輯 心緣
智東西11月21日杭州報道,上線僅三天,螞蟻集團首款全模態(tài)通用AI助手“靈光”便躋身iOS免費工具榜第一、App Store總榜第七,成為2025年底最受矚目的通用AI助手競爭者。
![]()
▲靈光App迅速登頂App Store免費工具榜(圖源:App Store)
阿里巴巴創(chuàng)始人馬云兩天前剛現(xiàn)身螞蟻園區(qū),他對這款產(chǎn)品寄予厚望。螞蟻集團CTO何征宇在采訪中透露,馬云期待這款產(chǎn)品能“往前沖第一”。而截至昨日下午,靈光App下載量已經(jīng)突破50萬,遠超團隊今年全年目標。
在字節(jié)“豆包”、深度求索“DeepSeek”以及同時阿里系的“千問”等通用AI助手已有一定聲量的背景下,螞蟻這次推出的“靈光”有什么獨特之處?又想要如何影響當下通用AI助手市場的格局?
為了探討這些問題,智東西等媒體昨日抵達杭州螞蟻園區(qū),與螞蟻集團CTO何征宇、靈光負責人蔡偉進行了面對面交流。
從產(chǎn)品基本面來看,“靈光”首批上線三大功能:“靈光對話”、“靈光閃應用”、“靈光開眼”。其開創(chuàng)性地在移動端實現(xiàn)“自然語言30秒生成小應用”,支持輸出3D數(shù)字模型、音頻、圖標、動畫、地圖等全模態(tài)信息,并且交互“絲滑”。(《螞蟻靈光App空降!太絲滑了,零門檻生成專屬應用》 )
![]()
▲靈光App擁有極簡的視圖(圖源:靈光)
而通過本次近兩個小時的采訪對話,我們對螞蟻AI超級入口戰(zhàn)略、靈光App設(shè)計理念及技術(shù)亮點以及整個通用AI助手賽道的產(chǎn)業(yè)趨勢,都有了更深入了解,主要信息干貨如下:
1、馬云內(nèi)部表示期待“靈光”團隊“往前沖第一”,并認為原定“年底20萬用戶”的目標“太低了”。
2、開發(fā)“靈光”的是一支200多人的AGI“探索小組”,從研發(fā)到工程都在統(tǒng)一主軸下工作。
3、不主動對標ChatGPT等競品,“不認為對標是一個特別好的目的”,認為現(xiàn)在談競爭為時過早。
4、與豆包、DeepSeek打差異化,一大特色是“一句話生成應用”功能,定位普惠、低門檻,與Cursor等專業(yè)工具也形成差異。
5、回應與“千問”的競爭:是共赴AGI的“戰(zhàn)友”和“兄弟”,并用“沙漠中分路找水”比喻協(xié)同探索。
6、“靈光”底層為多模型混合架構(gòu),采用了包括阿里“千問”及螞蟻自研開源模型等在內(nèi)的多個模型。
7、業(yè)內(nèi)首個基于全代碼生成的產(chǎn)品,類似于從Email進化到Web,背后解決了代碼輸出量比文本高“五六倍”的膨脹率帶來的流暢度挑戰(zhàn)。
8、認同“模型即產(chǎn)品”,明確靈光現(xiàn)階段是“Save time”的“效率類”產(chǎn)品,主軸并非情感陪聊。
9、承認產(chǎn)品存在不完美,但認為這是在“模型能力邊界上創(chuàng)新”必須付出的代價,并相信會快速優(yōu)化。
10、螞蟻支持幾大AI助手的算力儲備充足,AI Infra技術(shù)大大提高算力效率,“業(yè)務的成功掩蓋了我們技術(shù)的光芒”。
本次采訪的主要速記內(nèi)容如下,智東西做了不改變原意的編輯。
一、關(guān)于螞蟻AI超級入口戰(zhàn)略:不對標任何產(chǎn)品,馬云讓“沖第一”
Q1:前兩天,馬云先生出現(xiàn)在螞蟻園區(qū),他對這個產(chǎn)品有沒有什么評價?
答:馬老師他那天來肯定不是因為“靈光”(笑)。然后他今天早上跟我聊的是希望我們要“往前沖第一”。我跟他說的是,我們本來也沒這個期待,本來是準備玩一玩,年底到個20萬用戶,他說“這個目標太低了”。現(xiàn)在來看,我們昨天已經(jīng)完成了年底目標。
Q2:靈光APP與阿里千問App發(fā)布僅相隔一天,兩者有什么聯(lián)系?底層用的是千問模型嗎?
答:產(chǎn)品發(fā)布方面,我們確實沒有約好。我們?yōu)槭裁磿x18號?這是“靈光”自己算的,有了這么一個機緣巧合。靈光底層用了多個模型,也包括了千問,以及螞蟻自研的開源模型。
Q3:“靈光”有對標的產(chǎn)品嗎,比如ChatGPT?是否會與“千問”或其他產(chǎn)品共同爭奪“國民級AI應用”的頭把交椅?
答:我不認為對標是一個特別好的目的,它可能是你產(chǎn)品到一個階段后的結(jié)果。從產(chǎn)品的角度,我更愿意用發(fā)展的思路向前去看,說現(xiàn)在的模型能力是什么?現(xiàn)在產(chǎn)品表達是什么?半年后模型能力能演進到什么程度?能夠解決什么樣的用戶需求?我認為這個想法在AI時代是非常重要的。因為未來的若干年內(nèi),模型的能力依然在持續(xù)的演進,所以基于大模型的應用會是一個高速發(fā)展的市場,現(xiàn)在依然處在早期。
首先短暫的第一名可能是沒那么重要的,然后你去直接對標一個競爭對手也是沒那么重要,甚至是錯誤的。
其實這個理念在互聯(lián)網(wǎng)時代、移動互聯(lián)網(wǎng)時代已經(jīng)反復的在不斷地被驗證。就跟當年各種短視頻平臺扎堆,還有產(chǎn)品一騎絕塵,后來抖音突然在某一年橫空出世,并且在這幾年成為一個國民級應用。本質(zhì)上還是說這個賽道足夠的寬廣,給用戶體驗的提升空間非常大。
在現(xiàn)在AGI時代,我們認為是一樣的,這個賽道足夠的寬廣,然后模型的能力依然會有持續(xù)的很大的發(fā)展空間。我們要做的就是找準正確的方向,基于模型的能力向前看,一路狂奔。等我們奔到模型能力進展沒有那么快的時候,再去回頭看一看整個市場的格局是什么樣的,有哪些競爭對手。
Q4:具體聊一聊靈光App和千問App的競合關(guān)系。有人說“靈光”和“千問”的發(fā)布,意味著阿里系打出“通用+垂直模型”的組合拳,對此你們是怎么理解的?
答:我理解應該是共赴AGI的這種“戰(zhàn)友”和“兄弟”的感覺。
因為AGI的技術(shù)空間和市場空間都是巨大的,它也充滿著不確定性。我經(jīng)常打一個比方,就是說我在沙漠中要找水的話,我一定不會把所有人都派到一個方向走,一定是好幾路一起去找,誰找到了大家一起分,應該是個這樣一個邏輯。而且在很多的技術(shù)上,我們大家都比較開放,我們還開源了自研萬億參數(shù)模型;AGI時代就是開源開放時代,沒有這種開放精神,大家都很難進步。
Q5:為什么螞蟻不再把AI嵌入支付寶,而單獨推出一個靈光App?是如何與集團的其他板塊去協(xié)同的?
答:不是說不選擇嵌入支付寶。支付寶下拉的“快捷訪問”中的AI助手,其實還是運用了大模型技術(shù),比如可以用下拉語音對話叫車。每一個產(chǎn)品最關(guān)鍵的是說要有產(chǎn)品主張,或者說你到底解決什么問題。這些東西已經(jīng)在支付寶主端開始慢慢落地了,再單獨發(fā)一個App的話大家感知可能沒那么強。這又回到了第二個問題,就是我們很多技術(shù)已經(jīng)慢慢擴散到螞蟻的其他幾大支柱產(chǎn)品,大家都會陸續(xù)看到新進展。
Q6:你們短期內(nèi)會有什么目標?比如20萬下載量已經(jīng)達到,下一階段目標是多少?
答:我們沒有朝著什么對標去走,但我們希望被別人對標一下。20萬下載量是一個指標,它不是目標。靈感的目標還是我們想成為一個開放性的、有主張的、大家能喜歡的用戶產(chǎn)品。
二、關(guān)于“靈光”產(chǎn)品技術(shù)亮點:定位效率產(chǎn)品而非陪伴,移動端“手搓應用”是特色
Q7:靈光App的產(chǎn)品差異化特色是什么?
答:從產(chǎn)品特色的角度來講,我覺得“閃應用”毫無疑問是一個非常有特色的能力。現(xiàn)在已經(jīng)上線了兩天,我們在觀察用戶行為的時候,發(fā)現(xiàn)很多用戶會長輪次地用“閃應用”,這超出我們在上線前的預期——他們平均的在一個案例里修改達到6輪,其中有一個用戶他連搓兩個多小時,改了一百多次,做了一個應用。這是讓我們非常驚喜的地方,因為至少驗證它向某些用戶實現(xiàn)了實實在在的Deliver(交付)。
靈光App的“閃應用”是業(yè)內(nèi)第一個把“手搓應用”真的做到移動端的產(chǎn)品。產(chǎn)品本身足夠的新,雖然還不完美,但是對很多用戶來講,它解決了之前完全解決不了的問題,解放了很多人的一些生產(chǎn)力。
![]()
▲用靈光App一句話生成“記賬”和“云養(yǎng)貓”應用(圖源:智東西)
Q8:從3月立項到11月上線,團隊是如何確定了現(xiàn)在的三大核心功能(靈光對話、靈光開眼、閃應用)?中間是否經(jīng)歷過艱難的取舍?
答:在開始的時候,我們更多的是聊用戶的價值和主張,功能是在討論清楚價值之后在確定的。
當時我們有兩個判斷,一是判斷回合制的“主對話”方式,依然是一個天花板足夠高、能夠承載未來若干年模型能力發(fā)展的一種形式。所以就有了剛才的三大功能里面其中的兩大——“問答“和“閃應用”。
![]()
“開眼”是說,除了這種回合制的交互之外,我們有沒有實時的交互。其實人和人之間的交流大致也就分成這兩種:一種是你來我往,一種就是面對面的交流或打電話實時交流。所以這種回合制的交互和實時交互,是我們對產(chǎn)品本身在交互層面的一些思考。
![]()
回到“閃應用”,選用過程其實相對更特殊一點。今年1月我們整體在做規(guī)劃的時候,先出了一個視頻Demo,然后當時就把這種類似的可交互的功能規(guī)劃進去了。有一個有趣的小插曲,當時算法同學就看到設(shè)計同學在做這個視頻,他就說你們做得太酷炫了,問這是用來干什么的?設(shè)計同學跟他說做的是你們下個季度的OKR,然后那個算法同學就對不做聲了,默默的回到了座位。其實在那個時間點,我們也不知道這種實時可交互的方式,到底能不能夠在一個10秒左右的時間生成一個像今天這樣“閃電”般的的效果。但回過頭來看,好像一切順理成章。
![]()
在今年3月份的時候,這個事情沒有那么的明朗,當時確定的是Coding能力很重要,并且這個能力在不斷向前發(fā)展,但是到底能發(fā)展到什么程度?什么時候能達到用戶滿意的效果?其實這在當時有非常多的不確定性。但我判斷這是在AGI時代的一個核心能力,就設(shè)下了這個方向。
Q9:在進行快速研究時,靈光生成的內(nèi)容排版清晰、可讀性強。想請問,這類回答是否基于預設(shè)的呈現(xiàn)模板,還是主要由模型自身的生成能力驅(qū)動?
答:這也是這一代的AI產(chǎn)品跟之前的很多產(chǎn)品最大的一個區(qū)別。我們不再需要靠預設(shè)模板去達到好的效果。甚至你看同一個問題,刷新重新問一下,他可能會呈現(xiàn)不同的優(yōu)美排版,信息效率同樣的高。
![]()
▲靈光App生成的內(nèi)容圖文并茂、排版美觀(圖源:智東西)
這里面的核心的是我們的產(chǎn)品主張。比如說對于信息的獲取,我們有幾個維度是非常關(guān)鍵的要求:多、快、好、新。就是信息要豐富,信息出來的時間要短,你不能等個一兩分鐘;然后信息要好,這個好包括基礎(chǔ)準確性、閱讀體驗等。然后還有信息要新,比如今天上午發(fā)生的一些事情,我們中午去問就應該有相關(guān)的結(jié)果。
所以在這樣的產(chǎn)品主張的情況下,我們會把這樣的主張去學到模型里面,然后同時給模型一定程度上發(fā)揮空間,同時盡量限制他的幻覺。在這樣的情況下,我們才能做到相對絲滑的整體效果。它會更像一個人的回答。這里本質(zhì)還是依賴很多模型能力跟算法。
Q10:支付寶此前推出過“探一下”功能,“靈光開眼”在某些方面看起來也和“探一下”有共通之處,比如靈光也會分析場景里的精彩內(nèi)容,然后實時呈現(xiàn)到畫面之中。請問“靈光開眼”和“探一下”在技術(shù)實現(xiàn)或設(shè)計理念上,是否延續(xù)或借鑒了“探一下”的經(jīng)驗?
答:“探一下”是我們團隊去年的產(chǎn)品,它是在支付寶內(nèi)的一個功能。它的功能是當我看到一個場景,給它拍張照,它會針對這個照片進行一些分析,這是我們?nèi)ツ甑囊粋€視覺原生入口的嘗試,本身也有非常多的訪問用戶。
今年在靈光里面的“開眼”功能,是在“探一下”的基礎(chǔ)上做了一個升級。它不是只是拍一張照片做一些分析,而是能夠在實時的場景里去展示出你想要得到的信息。底層邏輯是我們認為“人與世界交互的方式是連續(xù)的”,所以“我們在AGI產(chǎn)品里面呈現(xiàn)的方式應該也是連續(xù)的”。但背后很多的算法技術(shù)、理念都是一脈相承的。
Q11:“閃應用”不支持修改代碼?
答:這也是一個產(chǎn)品主張。因為絕大部分人不具備直接修改代碼的能力。“靈光”在這個點定位跟Cursor不一樣(為專業(yè)用戶而生),靈光編程整體門檻會更低一些,另一方面它可能也會犧牲一些編程靈活度。
Q12:馬斯克預測未來5到6年之內(nèi),AI崛起會推動傳統(tǒng)App消失,靈光生成的應用會不會符合這個預期?
答:我認為未來這樣的形式創(chuàng)作會越來越普遍,它是一個大勢所趨。但至于說未來這樣形式的應用和傳統(tǒng)App是不是會共存,以怎樣的方式共存,并不是我們目前最關(guān)心的問題。但我相信共存方式還是以用戶價值為核心的。
Q13:請問靈光未來是否會考慮打造完善的閃應用生態(tài)體系,例如提供官方的應用托管平臺或應用市場?
答:未來這方面的能力是有待考慮的。我們核心還是希望能夠做到普惠,所以凡是符合這樣的產(chǎn)品主張的功能都是在考慮之內(nèi)的。
閃應用今天還是一個非常早期的形態(tài)。因為我們相信未來6-8個月內(nèi),整個模型的Coding能力肯定會越來越強。我們今天依然堅信這是一個技術(shù)演進的必然趨勢,所以閃應用肯定會越來越好,越來越豐富,就像GPT-3.5到GPT-5有一個過程。等時機成熟的時候,我們會自然而然地推出這種MarketPlace或生態(tài)平臺。但是它的一個前提是,我們的質(zhì)量可以達到“多、快、好、新”的精品,因為只有精品大家才有分享欲、消費欲。
Q14:靈光App實現(xiàn)了很不錯的一個交互,像一款GUI(圖形用戶界面)產(chǎn)品,之后在這方面會有什么更進一步的探索?
答:講實話,我們在推進產(chǎn)品中的思路不是說一定要做一個GUI的產(chǎn)品,核心還是希望在信息傳遞的過程當中實現(xiàn)效率最高。我們還是沿著這樣的一個產(chǎn)品主軸,再結(jié)合整個模型能力的突破。在這個過程中,我們發(fā)現(xiàn)模型寫代碼、調(diào)動各種工具,確實到了一個不僅是能夠降本增效,還具備生成用戶消費級內(nèi)容的一個臨界點。
然后對我們團隊,包括對整個螞蟻,在很多技術(shù)上面我們都走在科技的前沿,我們都會去嘗試現(xiàn)在最前沿最先進的技術(shù)。所以在這一塊,我們未來也依然會用閃應用形式、圖文并茂的呈現(xiàn)方式、多模態(tài)的形態(tài)等,還比如還未透露的SVG(可縮放矢量圖形)形態(tài),用這種形態(tài)為用戶講解“量子力學”、“波粒二象性”等動態(tài)演示效果。所以其實我們會做很多這樣的一些嘗試。
我們相信,在過去我們看到的互聯(lián)網(wǎng)上所有的內(nèi)容,本質(zhì)上都是用代碼生成的。只不過這些代碼以前都是人去寫的。未來我們完全有能力去重塑整個互聯(lián)網(wǎng)的內(nèi)容和服務生態(tài)。本質(zhì)上還是因為我們相信代碼能力越來越強,編程的能力越來越強。我們把這些能力用好,整個信息的呈現(xiàn)方式、交互方式會有質(zhì)的提升。
Q15:就我的體驗,靈光在生成圖片時對一些意境不是特別理解,文字潤色上會出現(xiàn)生硬的情況,接下來的產(chǎn)品會不會在這方面有更好的優(yōu)化?
答:下次你如果遇到這種情況,你刷新一下,可能結(jié)果就對了(笑)。
我覺得這是個很好的問題,它反映了兩個點:第一個點就是剛才聊的,我們是在模型的能力邊界上做一些創(chuàng)新,這就意味著可能并不是所有的能力都非常穩(wěn)。當然我覺得這也是需要付出的一些代價,如果去等所有的技術(shù)都非常成熟了,我們可能就失去了很多迭代跟先發(fā)的機會。這些問題隨著模型能力的提升,會變得越來越好的。
然后第二點,現(xiàn)在市面上但凡做得比較好的產(chǎn)品,它都有自己的產(chǎn)品主張,都是不一樣的。比如豆包里面很多打電話的功能很有特色,DeepSeek里的深度思考的功能也很有特色。對靈光App來講,也有自己的產(chǎn)品主場,我們需要做的都是把自己最擅長的那一部分打得非常的長。任何一個產(chǎn)品不是要解決所有人的所有的問題,這也是為什么世界上有非常多不同的公司。我們希望靈光能夠在最擅長的一些場景里打透打穿,這樣才能夠形成一個相對穩(wěn)定的用戶群,對這部分用戶創(chuàng)造更大的價值。
Q16:靈光定位一個更偏工具型的產(chǎn)品,產(chǎn)品設(shè)計中的取舍是什么考慮?比如它的記憶功能、陪伴情緒等功能方面與上下文等技術(shù)迭代速度上如何取舍?
答:我個人觀點是,上下文本身跟工具的屬性并不矛盾,或者說我們可能不一定要用工具這個詞。本質(zhì)上它解決的一類問題是效率類問題。現(xiàn)在大部分的互聯(lián)網(wǎng)產(chǎn)品可以分成兩類:一類是效率類,它要滿足用戶的需求,就是Save time(節(jié)省時間),說到底是在什么場景里怎么去Save time,比如百度搜索、大眾點評、ChatGPT等;還有一類產(chǎn)品其實是殺時間產(chǎn)品,比如說最典型的是抖音。很多時候大家可能是一天上班很累了,然后打開抖音去看一看。
一個產(chǎn)品開始的階段需要有一個主軸。我們的產(chǎn)品主張,是把靈光的主軸定位在效率側(cè)。當然你說一個產(chǎn)品發(fā)展到后面,它可能二者都會有涉及。那么在這個階段,靈光現(xiàn)在主打的功能并不是陪聊,不管是情感的陪聊還是IP陪聊,并不是目前產(chǎn)品的一個主張。我覺得這個更多還是對于一個新產(chǎn)品,我們還是認為想要先把長板拉得足夠長,然后再去補其他的短板,可能這是一個效率最高的方式。這也是一個更容易讓用戶記住,能夠創(chuàng)造更多用戶價值的。
三、關(guān)于通用AI助手賽道格局:“今天講的競爭不是競爭”,與豆包、DeepSeek打差異化
Q17:AI to C市場已有一些產(chǎn)品,現(xiàn)在入局,是否會覺得“起步稍晚”?比如字節(jié)豆包有抖音的流量,騰訊元寶有微信社交生態(tài),那么螞蟻“靈光”的底氣在哪?同時挑戰(zhàn)在哪?您如何看整個行業(yè)的競爭?
答:我還是不期待用競爭的視角去看這個東西,因為機會太大了。我們相信它是一個互聯(lián)網(wǎng)級別的機會,我們至今至少享受了30年的互聯(lián)網(wǎng)時代紅利。那大模型從2022年至今也才三年,我們還有很長的路要走。所以說你今天講的競爭,我認為都不是競爭。只是有人暫時在一個方向上找了一桶油,有人找到了一個蘋果。
第二個,在AI to C的這個方向上,我認為還是要看大家的理念是什么。比如豆包的打電話功能、DeepSeek擅長的推理模型,已經(jīng)能夠幫大家解決很多問題了,我們沒有去也特別關(guān)注這些。我們一直強調(diào)的是到底能幫用戶解決什么樣的真實需求,剛才說的信息獲取效率肯定是個問題和痛點,所以我們是朝著這個方向去走的。
而且我們相信,因為我們看到了這些問題,并堅持我們的技術(shù)理念,我們團隊所有一流的工程師都在這個方向去努力,那么我們肯定能走得比較快,或者比別人好。所以才能贏得我們今天超出預期的結(jié)果,我認為這是我們最大的底氣。
Q18:您說就是從年初開始組建這個AGI攻堅隊伍,你們是怎么去規(guī)劃這種產(chǎn)品和研究兩個方向的目標,你是怎樣去規(guī)劃AGI藍圖的?
答:我們不叫攻堅小組,叫探索小組。我們也不存在兩個目標,你們后面會看到你說的多位大佬的作品,都是在同一個賽道里面各司其職。
我認為今天的時代的紅利是什么?如果我們能夠把做的Research(科研)變成一個普惠的產(chǎn)品,我們就有更多的紅利。從這個邏輯來講,我們必須加快這個速度,加快循環(huán)效率。因為某種意義上,可以做的研究方向太多了,但從用戶視角去看產(chǎn)品,研究萬變不離其宗,就是一直講的效率。
我們有一系列的戰(zhàn)略選擇,為什么會做Diffusion(擴散模型)?是因為它的至少從Close generation(最近一代)的效率來講是非常好的;為什么會做Coding(編程)?我們堅信Coding既是語言的延伸,也是各種各樣的媒體的表達形式,那我們就要把效率做到極致;你今天看到的“靈光”的所有的東西,哪怕就是文字,它其實也是html,這里面其實對Research的要求是很高的。
其實很多朋友第一個反應是問你們?yōu)槭裁醋龅眠@么快?因為我們產(chǎn)生的代碼和同樣的文本來比,它的膨脹率是非常高的,大概有五六倍。那你如何能夠瞬間跟文字一樣的流暢地輸出?其實我們是在硬件利潤上,包括在模型架構(gòu),從數(shù)據(jù)到系統(tǒng)上下了很多功夫。
所以我想說的是,我們并不是說分頭在行動,而是說從研發(fā)到工程,到產(chǎn)品,都是在一個主軸上——就是如何讓用戶獲得信息的效更高。
Q19:如何看待“模型即產(chǎn)品”?
答:我認同“模型即產(chǎn)品”。作為一個產(chǎn)品來講,它本身就是要解決用戶的需求。解決用戶的需求其實有很多種方式,有時候我們用模型去解決,也有時候我們堆人去解決。大模型能力帶來了很多變化,我們會越來越傾向于用模型的方式解決,雖然很多時候短期內(nèi)堆人更快,但是這種方式往往是不可持續(xù)的。從這個角度來講,靈光的定位依然是一個非常純粹的技術(shù)產(chǎn)品——一個大模型出口。從這個角度來講,我認“同模型即產(chǎn)品”。
但另一方面,如果我們認為我們做好了一個基礎(chǔ)模型,其他什么也不用做,然后把這個模型扔在外面,它就會變成一個日活過億的國民級產(chǎn)品,我覺得大概率不會發(fā)生。原因是模型是一個底座,它提供了很多能力,但每個人的需求千差萬別,怎么才能夠嫁接模型能力到用戶具體的需求上,這里面其實是需要產(chǎn)品經(jīng)理、設(shè)計師、運營、算法、工程等團隊做很多的工作,共同去探索究竟模型的能力成長了,能解決哪些幾年前解決不了的用戶需求。
我們只有在模型能力跟用戶需求的邊界上不斷地探索,才有可能去挖掘出很多新的點。
其實“靈光”App里面的“閃應用”是一個非常典型的例子,我們在這個模型能力的邊界上找到了這么一個點,然后用普惠思維把它做到了移動端,讓每個人都能夠一句話生成應用。而在過去,無論你堆多少資源也做不到這樣的效果。
所以我覺得模型跟應用要齊頭并進,這也是我們整體去做大模型產(chǎn)品的一個理念。
Q20:靈光App在螞蟻生態(tài)當中的角色定位是什么?
答:我經(jīng)常開玩笑說一句話,就是“螞蟻業(yè)務的成功掩蓋了我們技術(shù)的光芒”。雖然“靈光”今年3月才立項,但前期所有的技術(shù)其實是轉(zhuǎn)化到了上來。今天來看,“靈光”還小,我們對他的愿景肯定是美好的。在AI時代,我們肯定得有一款自己的代表產(chǎn)品,可能是“AQ”、“螞小財”,也可能是“靈光”。但就像螞蟻當年從互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng)有了支付寶,然后有了余額寶、網(wǎng)商銀行一樣。
我們在不同的方向去探索,希望“靈光”成為所有人的全能的助手,“AQ”成為所有人的健康管家,“螞小財”成為每個人的“數(shù)字巴菲特”,這種愿景指引我們在不同方向上(前進)。其實就是盡你所能去找那口井的感覺。今天來看,我們不是說有一個推導目標,而是探索是一些不確定的東西,恰好這種不確定性帶來了非常好的機遇。
靈光區(qū)別于其他產(chǎn)品的地方,一是它站在我們技術(shù)的最前沿,二是它也是在一個不確定性中去尋找確定性的一個產(chǎn)品。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.