![]()
說真的,最近這兩年,AI 圈給我的感覺就一個字:卷。
各個大廠都在卷參數、卷跑分。但我們作為真的拿AI當工具干活的人,關心的是什么?
AI 能不能讓我少干點活,能不能幫我一鍵搞好選題,甚至能不能在我寫作一團漿糊的時候,給我一個清晰的思路。
今天,騰訊混元發布了他們的新模型 Hy3 preview。這是騰訊混元在預訓練和強化學習基礎設施重建后的第一個新模型,姚順雨他來了之后搞的,說實話我還是挺好奇的。
![]()
混元新模型,到底行不行?
這次的新模型,它新在哪?
根據官方的報道來看,相比過往的 2.0,它在推理能力和 Agent 能力上會有所升級。當然,這些官方信息我就不多念了,簡單來說,就是新模型更能思考,也更能干活了。
目前,這個模型在騰訊元寶以及騰訊龍蝦——WorkBuddy 上面都能使用。
![]()
至于它效果怎么樣?會不會和其他模型一樣喜歡胡說八道,我這邊剛好提前拿到了測試資格。
準備測試一下,看看它能不能幫我解決工作中的實際問題。
![]()
網上的瓜,它能辨真嗎?
作為一個有一定體量的科技博主,我們團隊每天最頭疼的其實不是寫文章,而是寫文章之前的“選題”。
基本上每天都會有熱點,但現在資訊這么發達,資訊的真假卻難辨。一個新聞爆出來,不到一小時內全網瘋傳,配圖、細節、時間線一應俱全,看著比真的還真。
![]()
但你要是信了,馬上讓下面的人跟進寫了文章,結果半天后官方辟謠了,那場面,你就說尷不尷尬?
昨天就出了這么一檔子事,一張“庫克宣布加入小米汽車”的圖片刷爆了科技圈,那叫一個天衣無縫,這么好的熱度,我們都差點想先謝為敬了。
直到后來小米高管出來辟謠,大家才知道是惡搞。
所以今天,我就把這個難題丟給混元,讓它評估一下這個信息的真實性,并給我理由。
其實我沒有抱太大希望,畢竟 AI 在處理這種多方信源交叉的事件時,經常會搞錯,最典型的就是 315 被揭露的 GEO,只要給它喂足夠多的“毒”,那它就會置事實于一旁。
![]()
不過沒想到,它不僅給了我一個判斷,甚至還給了我判斷的依據:
它抓取了全網 7 個權威信源,從官方社媒,到各大科技媒體的報道,相互交叉驗證,從而判斷信息的真偽。
![]()
最牛的是,它精準地抓住了幾個信息反轉的關鍵節點:
小米集團高管徐潔云的微博,當時第一時間出來辟謠,這是最核心的證據;同時翻看蘋果官網發布的消息,也有信息表示,庫克卸任 CEO 后將轉任執行董事;最后,再經多方辟謠,流言自然散去。
![]()
整個分析過程有理有據,邏輯鏈條非常清晰,特別是從蘋果官網尋找線索這一點尤為值得稱贊,一下子就把信息的真偽探了個大概。
![]()
AI 財報精讀機器
能辨別資訊真偽,在我這里已經算是生產力了,但是我想進一步看看它的工作能力如何。
我想起前段時間寫的那篇分析 Keep 的文章時的痛苦經歷:為了搞清楚他們這幾年的業務狀況,我硬著頭皮啃完了他們2023到2025連續三年的財報。
巨多內容,再加上苦澀難懂的專業用語,當時讀完后,我整個人感覺都被掏空了。
![]()
所以我把這三份PDF財報文件直接扔給了 Hy3 preview,讓它把 Keep23~25 年的關鍵財務數據整理出來,以及給我相關的核心結論。
等待結果的時候,我還在想我是不是過于為難它了,它會不會開始胡編亂造了?
但結果出來后,竟然還不錯。
![]()
因為第一眼,它真的做得很美觀,設計感很強的可視化報表,而且審美很在線,簡潔、清晰,線條和配色都透著一股高級的科技感。
![]()
最關鍵的是,它給很多數據都做了可視化表格,一眼就能看出 Keep 這 3 年來的財務動態。
其次,它給出的數據,準確無誤。不僅有每年的收入、毛利、毛利率等數據,
![]()
還把各版塊的財務狀況一并統計展示了出來,
![]()
最重要的是,它似乎明白月活用戶是互聯網企業的關鍵運營指標,所以竟然把這一數據單獨列出來了,它真的太懂了!
![]()
最后,它給出的結論還很一針見血,當時很多我花了好幾天才想到的觀點,它幾分鐘就搞定了。
例如說 Keep 在 2025 年的首次實現扭虧為盈,各版塊結構上的變化,活躍用戶數的下滑,它都有敏銳地捕抓到。
![]()
這個功能,給經常接觸數據的打工人來說,價值簡直不可估量,能讓我們更專注于數據背后的洞察和決策。
當然對于很多熱衷于大 A 的股民來說,可能也是一個很不錯的工具。
![]()
市場分析做得怎么樣?
最后,我還想給它做一個測試:最近手機市場價格暴漲,內卷加劇,未來的機會到底在哪里?
這是我最近很困擾的問題,因為作為博主,我們不應該只會看產品,更要看懂趨勢才行。
于是我讓混元以手機暴漲作為切入,分析一下當前手機市場的機會和陷阱。
這是一個開放性極強的問題,很多模型對于這樣的問題,只會做信息的搬運,但更關鍵的,應該是邏輯推理、趨勢預判和觀點輸出。
這次混元給的報告很長,但是質量也很高。
![]()
不僅全球市場做了一個整體的分析,
也對現在蘋果、三星,以及國產頭部廠商的市場博弈做了一頓分析,頗有幾分行業分析師的味道。
當然,到這里其實我已經挺滿意的了,但我還是再想壓榨一下它的性能,于是讓他把這份報告做成 PPT。
做出來的 PPT 嘛,整體效果談不上多驚艷,但絕對是“能用”的水平。
![]()
框架網站,邏輯清晰,我感覺找個AI再智能美化一下圖標,一份該質量ppt就完成了。
說實話,Hy3 preview 給我的感覺,確實有點不一樣。
過去兩年,我們看到了太多在參數、跑分上“屠榜”的模型,但一到實際應用場景,就瞬間拉胯。
而混元很明顯是有考慮用戶的真實應用場景,認真思考“用戶到底需要什么”。
可以預見,當混元這種更懂場景、更務實的能力,全面融入騰訊自家的社交、游戲、廣告、娛樂等各種場景業務后,或許還真能跑出不錯的效果。
看來這場 AI 戰爭,騰訊是第一個放下身段,真正做好應用的人。
編輯:志堅
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.