Baseten、DeepInfra、Fireworks AI 和 Together AI 正通過在 NVIDIA Blackwell 平臺上運行優化的推理堆棧,幫助各行業降低每 token 成本。
![]()
一次醫療領域的診斷洞察、一次互動游戲中角色的對話、一次來自客服代理的自主解決方案——這些由 AI 驅動的交互,皆基于同一智能單元:一個 token。
要擴展這些 AI 交互,企業需要考慮是否能夠承擔更多 token 成本。答案在于更優的 Token 經濟學(tokenomics)——其核心在于降低每個 token 的成本。這種下降趨勢正在各行各業中顯現。
近期麻省理工學院研究發現,基礎設施與算法效率的提升使前沿水平性能的推理成本正逐年降低至原來的 1/10。
要理解基礎設施效率如何提升 tokenomics,可以把它類比為一臺高速印刷機。如果這臺印刷機只需在油墨、能源和設備本身上進行小幅追加投資,就能實現 10 倍的產出,那么每頁印刷成本自然會下降。同理,對 AI 基礎設施的投資如果能帶來遠超預期的 token 產出,就會顯著降低每個 token 的成本。
正因如此,包括 Baseten、DeepInfra、Fireworks AI 和 Together AI 在內的領先推理服務提供商紛紛采用 NVIDIA Blackwell 平臺。Blackwell 平臺幫助這些企業將每個 token 的成本最多可降至 NVIDIA Hopper 平臺的 1/10。
這些提供商托管著先進的開源模型,其智能水平現已達前沿級別。通過融合開源的前沿智能、NVIDIA Blackwell 極致的軟硬件協同設計以及自主優化的推理堆棧,這些服務商正助力各行各業的企業實現 token 成本的大幅降低。
以上為摘要內容,點擊鏈接閱讀完整內容:領先推理提供商借助基于 NVIDIA Blackwell 平臺的開源模型,將 AI 成本削減至 1/10 | NVIDIA 英偉達博客
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.