<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      29個人,估值120億

      0
      分享至

      近日,美國AI初創(chuàng)公司LMArena宣布完成A輪融資,融資額為1.5億美元,投后估值達17億美元(約120億人民幣)。該輪融資由Felicis Ventures和加州大學伯克利分校旗下的投資基金UC Investments領投,A16Z、光速創(chuàng)投、The House Fund、LDVP、Kleiner Perkins等美國知名VC跟投。

      這筆融資之所以有意思,主要有三點:

      首先是LMArena的估值躥升非??臁K纳弦惠喨谫Y是2025年5月份的種子輪,由A16Z領投,當時估值是6億美元。也就是說,估值在七個月內翻了三倍,快速晉升獨角獸。

      其次是LMArena團隊規(guī)模極小。根據PitchBook等數據平臺截至2026年初的記錄,該公司員工總數僅有29人,相當于每個人估值四個億。

      最后,LMArena的產品看起來沒啥技術含量,很多人都覺得“我上我也行”。嚴格來說,LMArena并不是一家AI公司,它只是一個給大模型打分、做排名的網站,可以理解為大模型版的安兔兔。

      在各家大模型卷生卷死的時候,沒想到是一個大模型“跑分”工具最先賺的盆滿缽滿。

      無心插柳而來的獨角獸

      LMArena能成為獨角獸,其實是無心插柳的結果。

      LMArena起源于一個開源學術組織LMSYS Org,該組織由一些來自加州大學伯克利分校、加州大學圣地亞哥分校、卡內基梅隆大學等名校的學生、教授發(fā)起,核心使命是通過開發(fā)開源模型、系統(tǒng)和數據集,使大模型的使用和評估變得平民化。

      值得一提的是,LMSYS Org的華人含量非常高,伯克利的博士Lianmin Zheng、UCSD 的助理教授Hao Zhang、伯克利的研究員Wei-Lin Chiang等人都是核心成員。

      2023年3月,LMSYS Org發(fā)布了一款名為Vicuna的開源模型,性能可媲美ChatGPT。但是,他們發(fā)現當時市面上并沒有可靠的測試方法,可以真正區(qū)分出模型的好壞。于是,研究團隊在2023年4月推出了一個名為Chatbot Arena的開放測試平臺。沒想到,這個平臺在AI圈內越來越火。2024年9月,Chatbot Arena平臺正式更名為LMArena,目前已是全球大模型最權威的大模型評測平臺之一。

      LMArena的核心理念非常簡單,就是“匿名對戰(zhàn)”四個字。

      進入LMArena的網站之后,系統(tǒng)會要求你任意輸入一段提示詞,隨后系統(tǒng)會隨機挑選兩個AI模型生成對這段提示詞的輸出。用戶在不知道模型身份的情況下,對比兩個輸出的質量,選擇哪個模型勝出。勝出的模型加分,敗北的模型減分。經過數十萬、上百萬次這樣的對戰(zhàn)之后,就能得出每一個模型的最終得分。

      這一打分機制雖然簡單,卻用非常直接的方式,解決了大模型評測的核心痛點。

      傳統(tǒng)的大模型評測方式一般是“刷題”,比如MMLU(大規(guī)模多任務語言理解)、GSM8K(小學數學)和 HumanEval(代碼生成)。然而,隨著大模型的發(fā)展,這些評測正面臨三大致命挑戰(zhàn):飽和、污染與脫節(jié)。

      首先是飽和。隨著大模型的“刷題”能力越來越強,已經逼近人類上限,這類測試的區(qū)分度越來越小。如果大家都是90分甚至95分以上,考試就沒有了意義。

      再來說說污染。由于測試的考題通常在互聯(lián)網上公開,大模型也就可以預先進行針對性的訓練,使得測試結果被污染。

      最難以解決的問題是脫節(jié)??碱}與用戶的真實使用場景是不一樣的,會做題的大模型不一定能解決真實問題,“高分低能”的情況在大模型中同樣存在。

      而LMArena則通過收集真實的人類偏好,把大模型的評價方式從“考場考試”改成“競技場決斗”,一舉解決了上述這三大問題。

      現在,LMArena的排名已經被AI行業(yè)廣泛接受為最權威的“人類偏好”風向標,已經有400多個大模型被LMArena打分和排名,每月有數百萬個獨立用戶參與評測。無論是OpenAI、谷歌還是國內的各大AI公司,每次發(fā)布新模型都會送去LMArena打個榜,一旦拿到高分,一定會在發(fā)布會上大吹特吹一番。

      “打分”工具商業(yè)化,會被大廠“包養(yǎng)”嗎?

      2025年初,LMArena正式注冊為公司,開始從學術項目轉向商業(yè)化發(fā)展。

      一說到“跑分”,很容易讓人聯(lián)想到國內曾經大行其道的安卓跑分工具。這類工具通常有用戶、知名度和流量,但很難找到商業(yè)化變現的方式。最后的結局往往是被大廠“包養(yǎng)”,漸漸失去公信力,最后被用戶拋棄。LMArena是否也會面臨這樣的問題?

      答案當然是肯定的,LM Arena雖然尚未直接接受AI大廠的投資,但包括A16Z在內的VC機構重金投資了很多AI公司,間接的利益相關性也不容忽視。

      LM Arena在公信力上遭受的最大質疑,當屬2024年初在AI圈內鬧得沸沸揚揚的Meta“作弊”事件。

      2025年4月,Cohere、斯坦福大學、麻省理工學院等多家AI公司、高校的研究人員聯(lián)合發(fā)表了一篇文章,指責LM Arena幫助部分AI公司操縱排名。

      文章指出,Meta在發(fā)布Llama 4之前,私底下在LM Arena的平臺上測試了27個模型變體,但最終只公開了表現最好的一個模型的得分,以達到在排行榜上名列前茅的目的。另外,文章還認為,LM Arena偏向性的增加了包括Meta、OpenAI和谷歌在內的大廠的模型的“對戰(zhàn)”次數,使這些公司的模型排名獲得了不公平的優(yōu)勢。

      對于這些指責,LM Arena回應是“一些說法與事實不符”,并表示公布預發(fā)布模型的分數本身就是毫無意義的。

      為了維持透明度,LM Arena會開源部分代碼,并定期發(fā)布對戰(zhàn)數據集供研究者分析。但公正性的爭議恐怕會一直伴隨LM Arena的商業(yè)化。

      要做AI時代的產品“認證官”

      那么,如果不以犧牲公正性為代價,LM Arena還有哪些更好的商業(yè)化手段呢?

      2025年9月,LMArena正式推出第一個商業(yè)化產品AI Evaluations。AI Evaluations主要面向開發(fā)AI大模型的企業(yè)或研究機構,為它們提供模型評估服務。AI Evaluations在2025年12月的ARR(年度經常性收入,最近一個月收入乘以12)已達到了3000萬美元。

      考慮到AI Evaluations上線不到四個月,這樣的成績還算不錯。但它顯然還不足以撐起17億美元的估值。投資AI Evaluations的一眾硅谷VC,還看到了AI Evaluations的哪些潛力?

      在領投LMArena的種子輪融資后,A16Z曾發(fā)文解釋自己的投資邏輯,其核心觀點大致有三條:

      首先,A16Z認為LMArena的打分已經在“事實上”成為了評價AI大模型性能的標準,是AI產業(yè)發(fā)展的“關鍵基礎設施”。

      第二,LMArena打造了一個簡單而成功的飛輪機制:用更多模型吸引更多用戶,從而產生更多的偏好數據,進而吸引更多模型加入。顯然,這個飛輪一旦形成就是難以復制的壁壘。

      第三,A16Z認為中立、持續(xù)的評測,未來將是AI大模型監(jiān)管的剛需。

      A16Z預測了LMArena未來幾種可能的業(yè)務場景,其中最重要的一個就是為受監(jiān)管行業(yè)提供合規(guī)性支持,比如醫(yī)院或其它關鍵基礎設施。對于這些行業(yè)來說,AI的可靠性不是依賴AI公司的承諾,而必須通過透明、持續(xù)的評測來保證。A16Z暢想,“LMArena認證”未來將成為AI產品的“綠色認證”。LMArena平臺上的用戶評測次數,未來將不是數百萬次,而是數十億次。

      2025年初,LMArena推出了Inclusion Arena產品,直接通過API和SDK的方式將測試嵌入到真實的AI應用中,以收集生產環(huán)境中的反饋數據。截至2025年7月,該產品已收集了超過50萬次的真實對戰(zhàn)記錄。其價值不僅在于極大地增強了排行榜的參考價值,還事實上構建起了一個“AI的持續(xù)集成/持續(xù)部署管道”。

      A16Z承認LMArena面臨“在商業(yè)壓力下保持中立性”的巨大挑戰(zhàn),但是,能夠讓AI變得“可靠、可預測且值得信賴”的公司,未來將創(chuàng)造出最大的價值。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      斬獲9項奧斯卡電影金像獎的《英國病人》,究竟要告訴我們什么

      斬獲9項奧斯卡電影金像獎的《英國病人》,究竟要告訴我們什么

      冰咖
      2026-01-23 09:24:14
      1月24日周六:23家公司發(fā)重大利空,18家集體巨虧超400% 最高1900%

      1月24日周六:23家公司發(fā)重大利空,18家集體巨虧超400% 最高1900%

      股市皆大事
      2026-01-24 09:31:05
      砍32分統(tǒng)治比賽,活塞主帥:我們完全防不住杜蘭特

      砍32分統(tǒng)治比賽,活塞主帥:我們完全防不住杜蘭特

      懂球帝
      2026-01-24 12:26:15
      臺島表決結果出爐,55:48!柯建銘表態(tài)連任,吳思瑤美夢破碎

      臺島表決結果出爐,55:48!柯建銘表態(tài)連任,吳思瑤美夢破碎

      阿器談史
      2026-01-24 09:16:03
      美方表示允許中國購買委內瑞拉石油 外交部回應

      美方表示允許中國購買委內瑞拉石油 外交部回應

      新京報
      2026-01-23 16:00:01
      臺海定調!中國硬核表態(tài):攔截對臺軍售合法,外人沒資格置喙

      臺海定調!中國硬核表態(tài):攔截對臺軍售合法,外人沒資格置喙

      我心縱橫天地間
      2026-01-24 12:50:40
      “地震中消失的人去哪了?”網友的扎心評論,直接看哭了上萬網友

      “地震中消失的人去哪了?”網友的扎心評論,直接看哭了上萬網友

      另子維愛讀史
      2026-01-15 18:13:19
      “讓我睡一次,不然死給你看!”17歲少年持刀,威脅舅媽發(fā)生關系

      “讓我睡一次,不然死給你看!”17歲少年持刀,威脅舅媽發(fā)生關系

      有書
      2026-01-09 21:30:59
      巴鐵官宣加入,普京掏錢,特朗普新建“聯(lián)合國”,中方一句話回應

      巴鐵官宣加入,普京掏錢,特朗普新建“聯(lián)合國”,中方一句話回應

      滄海一書客
      2026-01-24 11:29:20
      廣東一男子用SIM卡煉出近200克黃金,價值21萬元

      廣東一男子用SIM卡煉出近200克黃金,價值21萬元

      東莞好生活
      2026-01-23 22:20:30
      張雨綺被抵制風波升級!原配曬她找律師威脅證據,網友呼吁封殺

      張雨綺被抵制風波升級!原配曬她找律師威脅證據,網友呼吁封殺

      萌神木木
      2026-01-24 12:38:01
      以后這4種房子將會淪為“窮人房”,不好住又賣不掉,趁早抽身!

      以后這4種房子將會淪為“窮人房”,不好住又賣不掉,趁早抽身!

      室內設計師有料兒
      2026-01-23 19:20:06
      環(huán)神的“天狐女”,真是一絕!

      環(huán)神的“天狐女”,真是一絕!

      貴圈真亂
      2026-01-22 11:00:43
      戴手銬走完二萬五千里,開國前夕去見毛主席,主席卻問:你是哪一個?

      戴手銬走完二萬五千里,開國前夕去見毛主席,主席卻問:你是哪一個?

      寄史言志
      2026-01-17 17:30:15
      官媒發(fā)文,趙心童再破天花板,讓羅伯遜和所有臺球名將“沉默”了

      官媒發(fā)文,趙心童再破天花板,讓羅伯遜和所有臺球名將“沉默”了

      璀璨幻行者
      2026-01-23 18:19:35
      謝潑德征服烏度卡!轟18分攜手KD拯救申京 3大理由讓他值得被重用

      謝潑德征服烏度卡!轟18分攜手KD拯救申京 3大理由讓他值得被重用

      鍋子籃球
      2026-01-24 13:06:13
      梁小龍去世6天,陳光標怒撕遮羞布:哪是病死,分明是被折磨死的

      梁小龍去世6天,陳光標怒撕遮羞布:哪是病死,分明是被折磨死的

      銀河史記
      2026-01-24 12:51:21
      譚晶曬一家四口全家福!11歲雙胞胎女兒在跳舞,老公是帥氣科學家

      譚晶曬一家四口全家福!11歲雙胞胎女兒在跳舞,老公是帥氣科學家

      史行途
      2026-01-23 18:17:52
      人民日報六評西貝:不會評論的做菜者不是一個好食客

      人民日報六評西貝:不會評論的做菜者不是一個好食客

      迷世書童H9527
      2026-01-24 10:44:15
      株洲1200元場地費后續(xù):村里石頭封路,拿刀者被扒,稱重情不貪錢

      株洲1200元場地費后續(xù):村里石頭封路,拿刀者被扒,稱重情不貪錢

      古希臘掌管松餅的神
      2026-01-23 14:26:34
      2026-01-24 13:44:49
      投中網 incentive-icons
      投中網
      創(chuàng)新經濟的智識與洞見
      12051文章數 15380關注度
      往期回顧 全部

      財經要聞

      “百年老字號”張小泉遭60億債務壓頂

      頭條要聞

      女子患癌為籌錢治病賣掉勞力士 收16萬元后賬戶被凍結

      頭條要聞

      女子患癌為籌錢治病賣掉勞力士 收16萬元后賬戶被凍結

      體育要聞

      當家球星打替補,他們在故意擺爛?

      娛樂要聞

      李微漪更新:狼王格林去世,3字淚目

      科技要聞

      特斯拉Cybercrab即將落地 每公里不到1塊錢

      汽車要聞

      有增程和純電版可選 日產NX8或于3-4月間上市

      態(tài)度原創(chuàng)

      家居
      數碼
      本地
      時尚
      公開課

      家居要聞

      在家度假 160平南洋混搭宅

      數碼要聞

      Mad Catz美加獅21按鍵鼠標M.M.O. 7+國行上市,到手999元

      本地新聞

      云游中國|格爾木的四季朋友圈,張張值得你點贊

      不一定能掀桌男主,但一定是個好演員!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 免费又黄又裸乳的视频| 亚洲成av人片在一线观看| 伊人在线视频| 在线天堂中文字幕| 亚州脚交| 国产亚洲精品AA片在线播放天| 久久久久久综合岛国免费观看| 中文字幕熟妇无码专区| 天堂8中文在线最新版在线| 亚洲国产一区二区三区久| 99中文精品7| 亚洲人成电影网站 久久影视| 特黄特色大片免费播放器999| 国产日韩精品一区二区三区在线| 国产伦孑沙发午休精品 | 两根大肉大捧一进一出好爽视频| 精品久久精品午夜精品久久| 中文字幕四区| 天天狠天天透天天伊人| 影音先锋2020色资源网| 久久精品成人免费观看| 九九成人在线| 免费裸体美女网站| 麻豆乱码国产一区二区三区| 久久凹凸视频| 777爽死你无码免费看一二区| 国产女高清在线看免费观看| 欧美交a欧美精品喷水| 欧美人成精品网站播放| 亚洲国产精久久久久久久春色 | 久操精品| chinese熟女老女人hd视频| V一区无码内射国产| 男女同房做爰爽免费| 无码任你躁久久久久久老妇| 天堂а√在线最新版中文在线| 三人成全免费观看电视剧高清| 吉水县| 国产精品免费视频网站| 女人爽到高潮的免费视频| 久久综合国产精品一区二区|