<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      給AI打個分,結果搞出17億估值獨角獸???

      0
      分享至

      聞樂 發自 凹非寺
      量子位 | 公眾號 QbitAI

      大模型競技場LMArena官宣拿下1.5億美元A輪融資。

      估值升至17億美元,妥妥的新年開門紅!



      這波融資由Felicis和加州大學投資公司UC Investments領投,Andreessen Horowitz、The House Fund等機構跟投。

      資本用真金白銀投票,足以見得AI時代大模型評估這個賽道有多香~

      而這支90后華人含量99%團隊的走紅之路,還得從2023年ChatGPT橫空出世后說起。

      從學術探索到商業崛起

      LMArena的前身是曾經火爆AI圈的Chatbot Arena,最早由LMSYS這個自發的開源組織創建。

      組織的核心成員全是來自UC伯克利、斯坦福、UCSD、CMU等頂尖高校的學霸。

      他們的開源推理引擎SGLang在業內首次實現了在96塊H100上跑出幾乎媲美DeepSeek官方報告吞吐量的開源方案。

      目前SGLang已經實現大規模部署,被xAI、英偉達、AMD、谷歌云、甲骨文云、阿里云、美團、騰訊云等企業和機構采用。

      不過,比起硬核技術,他們最主要也更出圈的工作是對大模型進行評估

      在ChatGPT、Claude一眾模型剛剛面世之際,他們率先創辦了Chatbot Arena這么一個第三方眾包基準測評平臺。

      LMSYS的創辦人之一、SGLang主導者鄭憐憫曾對我們透露,當時之所以創建Chatbot Arena,是因為他們自己訓練了小羊駝Vicuna的開源模型。



      當時他們覺得自己模型還不錯,但市面上已有的各種基準測試很難真正區分出模型是“真好”還是“假好”。

      團隊認為,評估模型最好的方式就是將其放到網上,讓用戶試用并投票。于是乎他們就搞了個眾包測試平臺Chatbot Arena,通過實際的用戶交互來評估模型性能。

      結果沒想到的是后來Chatbot Arena已獨立成一家公司,而小羊駝Vicuna等大模型的研發已經停滯。



      早期的Chatbot Arena搞的是雙盲測試,讓用戶在不知道模型身份的情況下盲選最優回答,這種模式吸引了大量AI愛好者來打卡。

      后來,全球各地一有新模型更新都會在里面偷偷測一把,Chatbot Arena逐漸成為模型測評首選的排行榜。

      這樣的影響力讓Chatbot Arena在AI領域嶄露頭角,獲得資本市場的認可。

      它獨立出來成為一家商業公司lmarena.ai,專注于AI模型評估。

      2025年5月,被曝獲種子輪1億美元投資,估值達到6億美元。

      動態競技場

      lmarena.ai的主要項目就是如今全球大模型的動態競技場LMArena。



      核心評估規則圍繞匿名對戰、Elo式評分和人機協同框架展開,方式也比較有意思。

      用戶只要輸入問題,系統就會隨機匹配兩個模型來做匿名回答。

      這時候大家不用管模型是誰,只需要根據回答的好壞投票選出更優的那個,系統在投完票之后才會揭曉模型的真實身份。

      在評分上,平臺基于Bradley–Terry模型設計了Elo評分機制,每個模型都有初始分數,贏了就加分,輸了就扣分,隨著對戰次數越來越多,分數會慢慢穩定下來,最終形成實時更新的排行榜。

      除此之外,平臺還采用了人機協同的評估模式,用人類的真實投票來反映大家對模型的偏好,再通過算法去平衡各個模型的出場次數、任務類型和樣本分布,避免有的模型因為曝光多就被高估,或者因為曝光少就被低估,確保整個評估過程公平客觀。

      就這樣,LMArena成了各家新模型“出道”時的必測榜單。當前Gemini 3 Pro以1490分位居榜首。



      去年拿到1億美元種子輪融資后,LMArena的發展迅速超出預期。

      在短時間內不僅累計了涵蓋文本、視覺、網絡開發等跨模態的5000萬張投票,完成了400余種開放及專有模型的評估,還產出了覆蓋文本、多模態、專家及職業等多個類別的14.5萬個開源戰斗數據點。

      現在,LMArena計劃將新籌集的資金用于平臺運營,確保平臺穩定且高效運行,提升用戶體驗。同時擴大技術團隊,為平臺發展注入更多專業技術力量。

      參考鏈接:https://news.lmarena.ai/series-a/

      — 完 —

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      女明星的“媽媽臀”上熱搜,網友吵翻了!醫生:適度的小肚腩和臀部脂肪是健康的

      女明星的“媽媽臀”上熱搜,網友吵翻了!醫生:適度的小肚腩和臀部脂肪是健康的

      極目新聞
      2026-01-21 15:48:28
      他屠盡城中婦女,還吃了自己老婆,殘忍如斯,為何還被后人景仰?

      他屠盡城中婦女,還吃了自己老婆,殘忍如斯,為何還被后人景仰?

      小豫講故事
      2026-01-20 06:00:08
      搞笑!董方卓社媒評論區淪陷,遭球迷問候:起床了,你爹進決賽了

      搞笑!董方卓社媒評論區淪陷,遭球迷問候:起床了,你爹進決賽了

      國足風云
      2026-01-22 07:47:44
      每周工作100小時!谷歌DeepMind CEO揭秘:中國對手是字節跳動,斷言谷歌是AI領域唯一全棧巨頭

      每周工作100小時!谷歌DeepMind CEO揭秘:中國對手是字節跳動,斷言谷歌是AI領域唯一全棧巨頭

      AI前線
      2026-01-22 14:39:28
      “原來走讀更容易學壞”,家長曬叛逆女兒,網友:可能已經懷孕了

      “原來走讀更容易學壞”,家長曬叛逆女兒,網友:可能已經懷孕了

      妍妍教育日記
      2026-01-21 18:16:13
      西方軍事專家:不同于其他大國,中國是全世界最完美的超級大國

      西方軍事專家:不同于其他大國,中國是全世界最完美的超級大國

      遁走的兩輪
      2026-01-10 00:17:12
      董潔在雪地直播賣羊絨大衣 全程沒吼沒催 只輕聲講設計 兩小時賣8億

      董潔在雪地直播賣羊絨大衣 全程沒吼沒催 只輕聲講設計 兩小時賣8億

      老吳教育課堂
      2026-01-22 00:43:43
      央視曝光,真別再吃了!頭皮發麻!市監局通報40批食品抽檢不合格

      央視曝光,真別再吃了!頭皮發麻!市監局通報40批食品抽檢不合格

      不寫散文詩
      2026-01-22 14:15:27
      30元都沒人收?馬鈔“通貨”遭集體拋棄,幣商這次徹底“不玩了”

      30元都沒人收?馬鈔“通貨”遭集體拋棄,幣商這次徹底“不玩了”

      老孟談錢
      2026-01-22 12:05:05
      韋德:我愚蠢地把04年奧運銅牌送人了,當時覺得除金牌外都一文不值

      韋德:我愚蠢地把04年奧運銅牌送人了,當時覺得除金牌外都一文不值

      懂球帝
      2026-01-22 11:22:52
      《霍元甲》主演黃元申曾出家又還俗,如今77歲,相貌發生很大變化

      《霍元甲》主演黃元申曾出家又還俗,如今77歲,相貌發生很大變化

      阿雹娛樂
      2026-01-22 14:10:48
      曾經風靡的紙皮核桃,為何如今很少人吃了?內行人:4個扎心原因

      曾經風靡的紙皮核桃,為何如今很少人吃了?內行人:4個扎心原因

      以茶帶書
      2026-01-19 19:24:33
      TOP14位身高170以上的女神,有顏有燈有演技

      TOP14位身高170以上的女神,有顏有燈有演技

      素然追光
      2026-01-02 02:45:02
      19投16中,爆砍40+11+7,抱歉東契奇:你的MVP懸了

      19投16中,爆砍40+11+7,抱歉東契奇:你的MVP懸了

      籃球大視野
      2026-01-22 16:14:19
      北京朝陽區衛健委出手!嫣然天使兒童醫院欠租糾紛有新進展

      北京朝陽區衛健委出手!嫣然天使兒童醫院欠租糾紛有新進展

      小陸搞笑日常
      2026-01-22 09:50:26
      金正恩視察溫泉療養設施,并在女賓浴場與女性們交談

      金正恩視察溫泉療養設施,并在女賓浴場與女性們交談

      隨波蕩漾的漂流瓶
      2026-01-22 18:30:40
      閆學晶偷稅8367萬被罰!直播圈“野蠻撈金”時代,真要涼了?

      閆學晶偷稅8367萬被罰!直播圈“野蠻撈金”時代,真要涼了?

      復轉這些年
      2026-01-22 21:14:11
      安世半導體事件再次上演?這次輪到濰柴動力,中企遭遇斬殺線!

      安世半導體事件再次上演?這次輪到濰柴動力,中企遭遇斬殺線!

      我心縱橫天地間
      2026-01-22 13:15:04
      72小時內,聯大爆發兩波爭端,中國禁止日本入常,解放軍開始上場

      72小時內,聯大爆發兩波爭端,中國禁止日本入常,解放軍開始上場

      科普100克克
      2026-01-22 17:53:21
      越共十四大代表投票選出第十四屆中央委員會

      越共十四大代表投票選出第十四屆中央委員會

      國際在線
      2026-01-22 19:39:02
      2026-01-22 21:44:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12050文章數 176362關注度
      往期回顧 全部

      科技要聞

      幾千億只是開胃菜,AI基建還得再砸幾萬億

      頭條要聞

      北約稱將確保中俄不在格陵蘭島有軍事立足點 中方回應

      頭條要聞

      北約稱將確保中俄不在格陵蘭島有軍事立足點 中方回應

      體育要聞

      跑個步而已,他們在燃什么?

      娛樂要聞

      車銀優賺800億 涉嫌逃稅200億!

      財經要聞

      西貝拿到“救命錢”,然后呢

      汽車要聞

      配備多塊娛樂屏 極氪8X內飾曝光

      態度原創

      親子
      本地
      數碼
      藝術
      公開課

      親子要聞

      讓娃更快適應幼兒園 記住這三點就夠了

      本地新聞

      云游中國|格爾木的四季朋友圈,張張值得你點贊

      數碼要聞

      分形工藝上架Pop 2 Air系列機箱,649元起

      藝術要聞

      一場雪,飄進了唐詩

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中国大陆精品视频XXXX| 麻花传媒在线观看免费| 亚洲日本一区二区一本一道| 日韩放荡少妇无码视频| 国产VA| 久热这里只有精品视频3| 一区色| 久久99国产伦精品免费| 美女视频黄的全免费视频| 亚洲精品熟女| 欧美黑人粗暴多交高潮水最多| 香蕉人妻av久久久久天天| 国产精品高清一区二区三区不卡 | 久久人人爽人人人人爽av| 亚洲国产日韩在线视频| 狠狠色综合网站久久久久久久| 又粗又大又硬又长又爽| av大片在线无码免费| 老太婆性杂交视频| 国产偷国产偷亚洲高清午夜 | 人妻精品久久久久中文字幕69 | 成年大片免费视频播放手机不卡| 少妇群交换乱p过程| 国产九九视频在线播放| av淘宝国产在线观看| 亚洲精品视频免费| 通江县| 安平县| 人妻一区二区三区蜜桃| 国产乱人妻精品秘| 欧美丰满熟妇xxxx性| 老太婆性杂交视频| 思思久99久女女精品| AV亚洲?电影AV?AV天堂| 亚欧成人无码av在线播放| 中文字幕一二三产区区别| 久久精品成人免费观看| 综合久久国产九一剧情麻豆| 一个人看的www视频免费观看| 久久综合激情网| 国产精品成人一区二区不卡|