蘋果的WWDC2024剛剛落下帷幕,評價卻褒貶不一。
支持者認為,蘋果能在語音助手、圖像編輯、Agent協作、APP打通、外部模型合作等多個維度結合AI能力,體現出一個龐大科技公司重壓之下的成功。
但反對派卻覺得,升級的Siri、基于AI的emoji和筆記創作,都是無聊的"雕花"功能,配不上三萬億市值。
眾說紛紜中產生的一個“大烏龍”是——發布會結束后不少用戶認為,蘋果的這些大模型能力均來自于OpenAI的GPT-4o。
甚至,還有一些自媒體言之鑿鑿,說Apple Intelligence是套殼GPT-4o,幾乎坐實"蘋果掉隊大模型"言論。
蘋果或許坐不住了。
就在今天,蘋果官方立刻發布了一篇文章,公布了Apple Intelligence背后,自研基礎模型的信息。
文中,蘋果表示Apple Intelligence背后的基礎模型,是自研的一個約30億參數的端側語言模型(Apple On-Device)和一個通過私有云計算并在 Apple 芯片服務器上運行的、更大的基于服務器的語言模型(Apple Server)。
而且,這些模型都針對蘋果用戶的日常行為進行了微調訓練。
現在,我們來一起看看這兩個模型的技術細節和競品對比。
![]()
![]()
詳解Apple On-Device和Apple Server
這次WWDC背后主要有兩個模型。
其中一個是端側模型,參數量為3B,可以直接在手機等終端設備上運行,對標微軟的Phi-3-mini、谷歌Gemma 7B等小模型。
另一個是更大的模型,沒有明確參數量,主要對標GPT-4。該模型可通過私有云計算,并在Apple的服務器上運行。
通過蘋果官方提供的測評,可以看出它的端側模型,也就是Apple On-Device,在總結、安全性、編碼、數學推理、分類等測試方面基本處于第一的位置。
而Apple Server,整體還略遜色于GPT-4 Turbo。
![]()
(基礎模型人工評估結果)
![]()
(總結評估)
![]()
(模型輸出有害性人工評估)
![]()
(Safety Prompts評估)
![]()
(指令遵循評估)
![]()
(寫作評估)
同時,蘋果還公布了用適配器fine-tune 的細節。比如使用適配器,即一些模型權重的小集合,相當于一個小型的插件,讓模型快速適應不同的任務。
![]()
![]()
例如,模型處理郵件和通知的總結,看起來差不多,但實際上有許多細微的差別。所以蘋果給模型用適配器,讓它能更好地完成這種任務。
其他內容還包括測試、合成數據等。
*更多技術細節參考:https://machinelearning.apple.com/research/introducing-apple-foundation-models
![]()
端側和多模態:蘋果的長期布局
今年以來,蘋果在模型方面動作頻頻。
最明顯地,是它自2月開始發布的一系列小型模型。這其中既包括可以讀懂iPhone屏幕的多模態理解模型ReALM(Reference Resolution As Language Modelling),還包括Ferret-UI。
4月,蘋果又發布一系列名為OpenELM(開源高效語言模型)的語言模型,提供2.7億、4.5億、11億和30億等多個規格的參數量。
以下是這些模型的基本情況和參數總結:
![]()
另外,蘋果在AI領域的投資和并購也圍繞"端側"和"多模態"兩大特點。
有信息指出,2023年蘋果至少收購了32家AI創業公司。
像近期對加拿大人工智能初創公司DarwinAI的收購,被很多人視作提升端側AI能力的布局之一。因為,DarwinAI的核心技術是能夠讓AI系統變得更小、更快。
而蘋果半年前收購的Datakalab,技術特點則是能夠通過面部識別和視覺數據分析人類情緒。
更早一些時候,也就是2020年,蘋果先后收購了兩家可以提升設備AI處理以及語言處理能力的AI公司,Xnor.ai和Voysis。
![]()
或許此次的WWDC沒有達到所有人對蘋果顛覆式創新的預期。
但蘋果對AI的投入不可否認——它不僅發布自研模型和收購AI相關公司補短板,也帶來豐富的AI用例,這點在發布會上有諸多體現(參考閱讀:Apple Intelligence:蘋果終于打響大模型時代第一槍)。
蘋果端側模型的想象力也不容忽視。今年以來,微軟、面壁智能、商湯、昆侖萬維等公司紛紛發力端側模型,說明這一領域很可能是下一個AGI大廠搶奪的高地。
但端側模型對計算和網絡通信效率要求嚴苛,模型的大小又限制了能力的涌現。對所有大廠來說,它都可能都是塊難啃的骨頭。這也讓人們更加期待蘋果未來的表現。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.