![]()
在人工智能行業內部,當人們討論大型語言模型的具體工作原理時,經常使用"前沿模型"這一術語。
但如果你不熟悉這個行業,可能并不真正了解這個詞的含義。你可以從"前沿"這個詞直觀地理解,這些是各公司正在推進的最大、最優秀的新系統。
描述前沿模型的另一種方式是將其稱為"尖端"人工智能系統,它們用途廣泛,是提升AI能力的整體框架。
當詢問ChatGPT時,它給出了三個標準——海量數據集、計算資源和復雜架構。
以下是前沿模型的一些關鍵特征,有助于你理解這些模型的工作原理:
首先是多模態性,前沿模型可能支持非文本輸入和輸出——如圖像、視頻或音頻。換句話說,它們能夠看和聽,而不僅僅是讀和寫。
另一個主要特征是零樣本學習,系統在較少提示下就能展現更強的能力。
還有那種類似智能體的行為,這讓人們開始談論"智能體AI"時代。
前沿模型實例
如果你想玩"猜模型"游戲,具體了解哪些公司在推進這項研究,你可以說OpenAI的GPT-4o代表了這樣一個前沿模型,具有多模態和實時推理能力。或者你可以推崇Gemini 1.5的能力,它同樣是多模態的,具有不錯的上下文理解能力。
你還可以指出許多其他在這類研究中表現出色的公司例子...但是,深入了解這些系統的構建如何?
剖析前沿領域格局
在最近的"行動中的想象力"專家小組討論中,一支專家團隊分析了在AI這一領域工作和創建前沿模型所需的條件。
小組主持人Peter Grabowski為前沿模型介紹了兩個相關概念——質量與充分性,以及多模態性。
"我們已經看到了文本模型的大量工作,"他說。"我們已經看到了圖像模型的大量工作。我們在視頻或圖像方面也看到了一些工作,但你可以輕松想象,這只是未來發展的開始。"
Contextual AI首席執行官Douwe Kiela指出,前沿模型需要大量資源,并指出"AI是一個資源密集型的事業"。
"我將成本與質量視為前沿,而那些實際上只需要在特定數據上訓練的模型,實際上模型的魯棒性就在那里,"Link Ventures董事總經理Lisa Dolan說(我也隸屬于Link)。
"我認為在性能方面仍有很大的增長空間,"Premji Invest副總裁Vedant Agrawal說。
Agrawal還談到了使用非專有基礎模型的價值。
"我們可以采用其他人訓練的基礎模型,然后讓它們變得更好,"他說。"所以我們真正專注于構成這些系統的所有組件,以及我們如何在它們各自的小類別中與它們合作?"
基準測試和互操作性
小組還討論了基準測試作為衡量這些前沿系統的方式。
"基準測試是一個有趣的問題,因為它同時是研究領域中最好和最壞的事情,"他說。"我認為這是件好事,因為每個人都知道目標和他們要努力的方向,這也是件壞事,因為你很容易操縱系統。"
這種"操縱系統"是如何工作的?Agrawal建議,真正以具體方式使用基準測試可能很困難。
"對于不深入研究領域的人來說,很難看著基準測試表格說,'好吧,你得了99.4分,而其他人得了99.2分,'"他說。"很難將那0.2%的差異在現實世界中的真正含義進行情境化。"
"我們查看基準測試,因為我們必須報告它們,但存在大量的基準測試疲勞,所以沒人相信它,"Dolan說。
后來,討論了一些關于10倍系統的內容,以及收集和使用數據的一些方法:
· 識別合同業務數據 · 使用合成數據 · 標注員團隊
當被問及這些系統的未來時,小組返回了這三個概念:
· AI智能體 · 跨學科技術 · 非變換器架構
觀看視頻可以獲得小組關于前沿構建的其余評論。
前沿界面的未來形態
這里有一個有趣的補充——出于對我們將如何在10年后與這些前沿模型交互的興趣,我向ChatGPT提出了這個問題。
以下是我得到的一些回應:
"你不會'打開'一個應用程序——它們將作為無處不在的后臺智能體存在,對語音、凝視、情感或任務提示做出響應...你的AI知道你在開會,它讀取你的情緒狀態,聽到正在說的話,并準備摘要+下一步行動——在你詢問之前。"
這結合了兩個方面,即新系統可能的模式和感覺。
這回到了個人化方法,我們開始更多地將這些模型視為同事和對話伙伴,而不是從計算機屏幕上凝視你的東西。
換句話說,PC-DOS命令行系統的時代已經結束。Windows將計算機界面從單行單色系統改變為色彩鮮艷的窗口、重新框架和基于工具的桌面方法的充滿活力的系統。
前沿模型將為我們的界面進步感做得更多。
這將是巨大的變化。敬請期待。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.