網易首頁 > 網易號 > 正文申請入駐

體驗kimi 的新功能后，我為月之暗面捏把汗

2025-04-30 17:15:22　來源: 藍字計劃

廣東舉報

分享至

作者｜Hayward

原創首發｜藍字計劃

過去半年，AI行業可謂是群芳爭艷。

DeepSeek R1橫空出世成了明日之星，騰訊元寶、豆包、夸克等也搭上了DeepSeek的便車吃香喝辣，還有誓要在技術上和DeepSeek R1的一較高下的阿里通義千問捷報頻頻…

唯獨去年的投放王者，鋪天蓋地出現在各個廣告位的kimi，好像一下子沒了消息。

而就在這幾天，我們終于等到了kimi的“大動作”。4月28日，kimi宣布和財新傳媒達成合作，當用戶使用Kimi提問財經相關內容時，Kimi“將結合財新傳媒旗下專業報道內容，通過模型生成答案，為你提供及時、可信、可證的高質量財經信息”。

好家伙，當我們以為kimi已經擺爛躺平的時候，原來還是有在暗地里偷偷努力的。

選擇和財新網合作發力財經垂直領域，kimi的確對AI工具的發展路線有了一些自己的新思考。

畢竟只比模型能力，kimi肯定不如能免費接入的DeepSeek，但與專業財經媒體強強聯合，甚至日后拓展到和更多垂直領域的專業媒體合作提供信源，能增強kimi在特定垂直領域的公信力，長期來看大有可為。

不過在kimi發布了合作消息后，我就第一時間測試了擁抱新功能的kimi。從測試結果來看，我有點想收回上面劃線的這段話……

向AI幻覺開刀

kimi這波和財新網的合作，長期來看是能給其他AI工具帶來一些啟發的。

自2025年初AI大爆發以來，各式各樣的AI工具不僅給我們帶來了便利，也帶來了一些問題，最嚴重的要數 ”AI幻覺”。

簡單來說，AI幻覺指由AI生成的看似合理但實際錯誤的信息。這些信息可能是一段文字里的部分數據、可能是不同場景的張冠李戴，甚至可以是某個論斷全是無中生有的。

這很容易會給AI的使用者帶來全方位的不安全感，這就意味著不僅你用AI來查數據容易得出錯誤的信息，甚至一些學術概念、對某些事物的定義都可能是AI自己編造出來的。

目前業界對于AI幻覺的成因還沒有一個統一且準確的答案，但普遍認為AI幻覺和訓練AI的數據缺陷、模型或訓練機制缺陷、生成和推理缺陷和外部環境與驗證的缺失等有關。

這幾個原因中，數據缺陷最為關鍵。如果在訓練AI時喂養了錯誤或過時的數據，輸出時就容易給出錯誤的答案，可以理解為AI被“教壞了”。

而數據又是AI輸出答案的“源頭”，一開始的數據就錯了，無論后期模型結構和訓練數據的方式如何調整、生成和推理過程怎么優化，都很難輸出正確的答案。

特別是財經領域的內容，權威數據、專業論斷是底色，確保AI所引用的數據來源的權威性這件事的確非常重要。

相比過去一些AI工具用各種方式篩選可靠信源的做法，kimi的確算得上“簡單粗暴”，直接和權威的信源合作，更加細化地限定了AI資料來源的范圍，理論上的確能在數據來源層面降低kimi出現AI幻覺的可能性。

那Kimi和財新網合作之后到底效果怎么樣？咱們直接來實測看看。

不盡人意

剛好4月29日瑞幸發布了2025年第一季的的財報，當前對財報進行分析的媒體還不多，這是個測試kimi能不能勝任財報分析工具的好機會。

在kimi的問題窗口中我選中「長思考」增強大模型的邏輯推理能力，提示詞為“分析一下瑞幸的最新財報”，可以看到kimi的確能識別到所謂的“最新財報”是指2025年第一季度財報。

在關鍵的數據抓取方面，總凈收入、營業利潤與利潤率還有GMV等沒有出現數據錯誤的問題，對于瑞幸大家比較關心的門店數量、擴張情況還有成本等信息，kimi也能給到了。

不過，kimi的這份“財報分析”，更像是一種數據的提取和匯總，對于瑞幸業務的整體趨勢、變化與增長，沒有太詳細的見解。

而且更令人無語的是，問kimi這個問題，我根本不知道和財新網合作給kimi帶來了多少助力：因為整個回答的內容引用，根本沒見到財新網的影子。

難道是財新網根本沒有寫瑞幸最新財報的分析？No No No，4月30日財新才新鮮出爐了一篇針對瑞幸最新財報的分析，標題為《瑞幸咖啡一季度同店銷售額重回增長黎輝接任公司董事長》。

如果你想在讓kimi和財新網的內容聯結起來，得把提示詞換成“結合財新網的內容，對瑞幸最新的財報進行分析”。

這時，在數據來源這一塊終于能看到帶有小藍標的財新網了。除了上面提到的財新網最新的財報分析外，還引用了不少財新網之前為瑞幸撰寫的文章，同時kimi也會參考第三方財經平臺的內容，對瑞幸的財報進行分析。

內容方面，調整了提示詞后新的內容的確更加扎實，在數據之外還會對內容進行進一步的概括和總結，比如在談及瑞幸的財務數據時，會結合歷史同期的數據，總結出“盈利能力正在不斷增強”的觀點。

另外，由于財新網的文章重點提到了瑞幸的管理層變更及后續影響，kimi的財報分析也在最后段落增加了相關內容，讓分析的段落格式和財新的內容基本保持一致。

客觀來說，加入了財新網的關鍵詞后的確能提高整篇財報的可讀性，特別是部分段落融入了財新網的觀點后，讓文章內容更加豐滿，能幫助財經小白更容易看穿冷冰冰數字背后的深意。

只是，依然尷尬的點是，調整提示詞后的財報分析，只有最開始的一段數據來源是財新網，后續內容的數據依然是來自第三方網站，理想中的“財新網為kimi背書”的作用有限。

特別是如果不添加提示詞，kimi大概率不會主動抓取財新網的內容作為數據來源，這對用戶的學習成本就有點高了。而且哪怕添加了專門的提示詞后來自財新的內容也不多，這毫無疑問會削弱kimi在財經這一垂直領域的“專業”印象。

再者，對比kimi輸出的內容和財新原版的內容，kimi更多只在做提取部分內容進行總結、加工的工作，從內容專業度、權威性來考慮，可能還不如直接看財新網的報道更加簡單直接。

不過考慮到想看財新網的全部內容需要付費訂閱，或者kimi的意義就在于作為一個免費渠道看財新網的付費新聞？

但財新網自身的價值就在于付費訂閱業務，于情于理都不可能答應的，而Kimi的最終目的肯定也不止于此。

所以目前看來kimi看似和財新是“強強聯合”，但根本沒有發揮出這次合作應有的價值。

Kimi的根本問題在于，即便有權威媒體作為信源，但依然沒有能力在AI生成方面結合數據生成獨特的、有價值的答案來。

這里再淺淺對比一下DeepSeek R1，同樣的“分析一下瑞幸的最新財報”提示詞，DeepSeek給出的財報分析十分詳細，除了常規的財務表現、門店表現、成本和市場戰略等數據外，還主動提到了董事會調整、股權結構變化的關鍵信息。

最后的瑞幸財報所體現的風險和未來展望，更是kimi的財報分析中沒有的。

在分析的細致程度上也是DeepSeek更勝一籌。比如在分析成本壓力時，DeepSeek會提到和咖啡豆的成本上漲有關，而kimi只用一句“成本有所上升”簡單帶過。

你看，不需要接入專業、權威信源的DeepSeek，照樣能輸出和kimi不相伯仲的內容來。

你很難說kimi選擇的這條路線沒意義，但kimi的阿喀琉斯之踵，依然是大模型性能。

算力是一切

引用優質數據源，只是對付AI幻覺、提升體驗最基礎的第一步。除此之外還需要更先進的LLM、匹配更高算力、更強大算法并對內容進行審核檢驗等，多個步驟協同進化，提升大模型的整體性能，才能將AI幻覺降到最低。

所以你可以看到哪怕DeepSeek沒有像kimi和專業的數據源合作，也能提供更優秀的內容，這背后是DeepSeek在LLM層面、算力/算法層面全面領先的證據。

Kimi和DeepSeek模型能力的差距，已經是引入權威信源都無法彌補的了。

同時這也揭露了當前AI工具領域的一個殘酷事實：算力就是一切。

大公司或技術領先公司，能拿到更多算力、能更高效運用算力、能更好的發揮算法優勢，最終訓練出更加先進、聰明的大模型，模型能力的差距能抹平一切“彎道超車”的手段。

“力大磚飛”，可能才是AI的唯一出路。

其實在測試之前，我對kimi還是保有很高期待的。眾所周知財經問題對數據的準確性非常高，一些事實判斷也需要非常高的專業度，這些都是使用AI工具咨詢財經問題時最怕出現幻覺的痛點。

本以為kimi和財新的合作是一次顛覆，但至少目前看來，kimi想要開辟出一條全新的道路還“任重道遠”。

或許，AI幻覺問題還是只能交給萬眾期待的DeepSeek R2來解決了？

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

DeepSeek-R1推理智能從哪來？谷歌研究：模型內心多個角色吵翻了

機器之心Pro 2026-01-26 14:15:48
0 跟貼 0
如何為LLM智能體編寫工具？Anthropic官方教程來了

機器之心Pro 2025-09-12 21:50:08
0 跟貼 0

上海交大給具身智能發了一張“統考卷”，這會是機器人的LMArena嗎？

智東西 2026-01-26 18:23:18
0 跟貼 0

釘釘發布DeepResearch多智能體框架，已在真實企業部署

機器之心Pro 2025-11-12 13:06:22
2 跟貼 2
AP2O-Coder 讓大模型擁有「錯題本」，像人類一樣按題型高效刷題

機器之心Pro 2026-01-14 15:07:07
0 跟貼 0

5年博士1年讀完，20分鐘干完48小時教授工作！這個工具在硅谷火了

新智元 2026-01-27 08:12:22
0 跟貼 0

高通萬衛星談終端大模型優勢：個性化與數據推理

量子位 2025-12-11 03:38:41
0 跟貼 0
美聯儲殺人，AI埋尸？牛津曝光L型死局：10億打工人再無歸路

新智元 2026-01-27 08:12:16
0 跟貼 0

49條中日航線取消全部航班

財聯社 2026-01-26 17:10:34
42273 跟貼 42273
花一萬元植入DeepSeek，一場沒有終點的流量游戲

36氪 2025-09-05 13:09:55
3 跟貼 3
我在網游里被三個 AI 貼臉開大，只有 Kimi 想救我

AppSo 2026-01-25 18:02:20
2 跟貼 2
王嘉爾熬夜做PPT上熱搜？打工人醒醒，AI時代早就不用這么卷了！

秋葉PPT 2026-01-23 08:19:55
0 跟貼 0
潛水時，為何不能快速上浮？看下水瓶的測試結果就知道了

地球科普記 2026-01-24 16:54:08
1 跟貼 1
【DeepSeek談藝】姜向東·風景油畫丨鋪陳四時意，繪就鄉野情

文化視界網 2026-01-25 17:44:11
0 跟貼 0
【DeepSeek談藝】孫志純·油畫 | 筆落山川意，繪盡自然野趣

文化視界網 2026-01-26 16:21:28
0 跟貼 0
黃金白銀的盡頭在哪？下周A股迎來一個漲價題材

每日經濟新聞 2026-01-26 01:15:36
0 跟貼 0
女生一襲白裙走在校園，三分似她就已經很權威了！

理想之聲 2026-01-25 13:40:05
0 跟貼 0
四大天王之爭：數據與獎項之外的藝術多元與持久影響

泛舟碧波湖水 2026-01-25 04:52:03
0 跟貼 0
丹麥網友"眾籌"1萬億美元收購加州美國網友熱烈回應

紅星新聞 2026-01-26 17:52:54
3779 跟貼 3779
克里姆林宮：俄方不再與卡拉斯打交道

參考消息 2026-01-26 15:32:08
1011 跟貼 1011
雷軍還是太權威，小米su7一上路秒殺所有車，新手司機被教育！

二哈笑出聲 2026-01-22 16:10:15
3 跟貼 3
商務部：一視同仁支持外企參與提振消費、政府采購、招投標等

證券時報 2026-01-26 15:43:03
5750 跟貼 5750
劉強東臘八下單萬件年貨送老鄉，今年還將為光明村打造村晚

極目新聞 2026-01-26 13:27:18
65 跟貼 65
媽媽給女兒化肯豆妝容，“這眼睛是真的好看啊”，網友：這臉長得也太權威了

童話鶴壁 2026-01-24 11:55:36
0 跟貼 0
【城事】上海華亭賓館改造收官，2月10日試運營

上觀新聞 2026-01-26 19:57:15
138 跟貼 138
LPL熱度下滑有多嚴重？TES公布財報，相比去年收入下降40%

新游戲大妹子 2026-01-24 12:24:25
5 跟貼 5
背刺中國，出賣孟晚舟的真兇被挖出來后，如今遭到了哪些報應

暖心萌阿菇涼 2026-01-24 09:01:01
17 跟貼 17
市民吐槽羊城通突然欠費一千多萬？官方回應了

南方都市報 2026-01-26 20:17:06
58 跟貼 58
中國民航大學空管學院，就業崩了？

勛哥教你填志愿 2026-01-27 07:07:13
0 跟貼 0
智界R7風阻0.217破紀錄：趙長江：是吹出來的，不是吹出來的！

創作者_1470992743975 2026-01-26 13:26:48
14 跟貼 14
比亞迪公布國際專利申請：“汽車引擎模擬音揚聲器以及汽車”

證券之星 2026-01-24 09:33:39
0 跟貼 0
C919新年交付開門紅被指今年有望實現每15天造一架

澎湃新聞 2026-01-26 22:25:24
232 跟貼 232
從年薪70萬到月薪7000，再到徹底失業，他只用了4年

流蘇晚晴 2026-01-22 18:24:17
12 跟貼 12
三分之一學校不足200人但崇明拒絕“一關了之”

看看新聞Knews 2026-01-27 00:45:03
3 跟貼 3
杰富瑞提醒AI行業主角變陣：存儲巨頭接棒本周集中公布財報！

財聯社 2026-01-26 16:30:06
0 跟貼 0
湖南人眼中的權威特產有哪些

飯匹兄弟官方賬號 2026-01-23 19:14:58
0 跟貼 0
印度尼帕病毒現跨區域傳播世衛:或引起全球大流行

參考消息網 2026-01-27 02:25:54
8 跟貼 8
給環衛工人戴定位器工牌，第一財經評論：管理精細不該犧牲尊重，環衛工人不是牛羊更不是罪犯！這么

究竟視頻 2026-01-26 11:42:31
0 跟貼 0
重要提醒！中國公民春節期間避免前往日本

封面新聞 2026-01-27 06:28:32
1 跟貼 1
A股限售股解禁一覽：234.46億元市值限售股今日解禁

財聯社 2026-01-27 07:33:05
0 跟貼 0

藍字計劃

記錄智能時代的每一次浪潮！前沿科技捕手，AI產品深度洞察。

211文章數 3875關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

教育

數碼

健康

公開課

家居要聞

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
中國最正宗的紋飾是什么？
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

體驗kimi 的新功能后，我為月之暗面捏把汗

理想開始關店“過冬”，否認“百家”規模

上海一女子嫌風水不好 屢次掰歪小區兩塊反光鏡

上海一女子嫌風水不好 屢次掰歪小區兩塊反光鏡

叛逆的大公子，要砸了貝克漢姆這塊招牌

張雨綺被抵制成功！遼視春晚已將她除名

從美式斬殺線看中國社會的制度韌性構建

賓利第四臺Batur敞篷版發布 解鎖四項定制創新

態度原創

流韻雅居，讓復雜變純粹

舟山嵊泗縣取消

英特爾高管批評AMD Strix Halo效率低 稱高性能應依托獨顯而非大功率核顯

耳石脫落為何讓人天旋地轉+惡心？

上海一女子嫌風水不好屢次掰歪小區兩塊反光鏡

上海一女子嫌風水不好屢次掰歪小區兩塊反光鏡

賓利第四臺Batur敞篷版發布解鎖四項定制創新

英特爾高管批評AMD Strix Halo效率低稱高性能應依托獨顯而非大功率核顯