<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      體驗kimi 的新功能后,我為月之暗面捏把汗

      0
      分享至



      作者|Hayward

      原創首發|藍字計劃

      過去半年,AI行業可謂是群芳爭艷。

      DeepSeek R1橫空出世成了明日之星,騰訊元寶、豆包、夸克等也搭上了DeepSeek的便車吃香喝辣,還有誓要在技術上和DeepSeek R1的一較高下的阿里通義千問捷報頻頻…

      唯獨去年的投放王者,鋪天蓋地出現在各個廣告位的kimi,好像一下子沒了消息。

      而就在這幾天,我們終于等到了kimi的“大動作”。4月28日,kimi宣布和財新傳媒達成合作,當用戶使用Kimi提問財經相關內容時,Kimi“將結合財新傳媒旗下專業報道內容,通過模型生成答案,為你提供及時、可信、可證的高質量財經信息”。



      好家伙,當我們以為kimi已經擺爛躺平的時候,原來還是有在暗地里偷偷努力的。

      選擇和財新網合作發力財經垂直領域,kimi的確對AI工具的發展路線有了一些自己的新思考。

      畢竟只比模型能力,kimi肯定不如能免費接入的DeepSeek,但與專業財經媒體強強聯合,甚至日后拓展到和更多垂直領域的專業媒體合作提供信源,能增強kimi在特定垂直領域的公信力,長期來看大有可為。

      不過在kimi發布了合作消息后,我就第一時間測試了擁抱新功能的kimi。從測試結果來看,我有點想收回上面劃線的這段話……



      向AI幻覺開刀

      kimi這波和財新網的合作,長期來看是能給其他AI工具帶來一些啟發的。

      自2025年初AI大爆發以來,各式各樣的AI工具不僅給我們帶來了便利,也帶來了一些問題,最嚴重的要數 ”AI幻覺”。

      簡單來說,AI幻覺指由AI生成的看似合理但實際錯誤的信息。這些信息可能是一段文字里的部分數據、可能是不同場景的張冠李戴,甚至可以是某個論斷全是無中生有的。

      這很容易會給AI的使用者帶來全方位的不安全感,這就意味著不僅你用AI來查數據容易得出錯誤的信息,甚至一些學術概念、對某些事物的定義都可能是AI自己編造出來的。

      目前業界對于AI幻覺的成因還沒有一個統一且準確的答案,但普遍認為AI幻覺和訓練AI的數據缺陷、模型或訓練機制缺陷、生成和推理缺陷和外部環境與驗證的缺失等有關。

      這幾個原因中,數據缺陷最為關鍵。如果在訓練AI時喂養了錯誤或過時的數據,輸出時就容易給出錯誤的答案,可以理解為AI被“教壞了”。

      而數據又是AI輸出答案的“源頭”,一開始的數據就錯了,無論后期模型結構和訓練數據的方式如何調整、生成和推理過程怎么優化,都很難輸出正確的答案。

      特別是財經領域的內容,權威數據、專業論斷是底色,確保AI所引用的數據來源的權威性這件事的確非常重要。

      相比過去一些AI工具用各種方式篩選可靠信源的做法,kimi的確算得上“簡單粗暴”,直接和權威的信源合作,更加細化地限定了AI資料來源的范圍,理論上的確能在數據來源層面降低kimi出現AI幻覺的可能性。

      那Kimi和財新網合作之后到底效果怎么樣?咱們直接來實測看看。



      不盡人意

      剛好4月29日瑞幸發布了2025年第一季的的財報,當前對財報進行分析的媒體還不多,這是個測試kimi能不能勝任財報分析工具的好機會。

      在kimi的問題窗口中我選中「長思考」增強大模型的邏輯推理能力,提示詞為“分析一下瑞幸的最新財報”,可以看到kimi的確能識別到所謂的“最新財報”是指2025年第一季度財報。



      在關鍵的數據抓取方面,總凈收入、營業利潤與利潤率還有GMV等沒有出現數據錯誤的問題,對于瑞幸大家比較關心的門店數量、擴張情況還有成本等信息,kimi也能給到了。

      不過,kimi的這份“財報分析”,更像是一種數據的提取和匯總,對于瑞幸業務的整體趨勢、變化與增長,沒有太詳細的見解。

      而且更令人無語的是,問kimi這個問題,我根本不知道和財新網合作給kimi帶來了多少助力:因為整個回答的內容引用,根本沒見到財新網的影子



      難道是財新網根本沒有寫瑞幸最新財報的分析?No No No,4月30日財新才新鮮出爐了一篇針對瑞幸最新財報的分析,標題為《瑞幸咖啡一季度同店銷售額重回增長 黎輝接任公司董事長》。



      如果你想在讓kimi和財新網的內容聯結起來,得把提示詞換成“結合財新網的內容,對瑞幸最新的財報進行分析”。



      這時,在數據來源這一塊終于能看到帶有小藍標的財新網了。除了上面提到的財新網最新的財報分析外,還引用了不少財新網之前為瑞幸撰寫的文章,同時kimi也會參考第三方財經平臺的內容,對瑞幸的財報進行分析。

      內容方面,調整了提示詞后新的內容的確更加扎實,在數據之外還會對內容進行進一步的概括和總結,比如在談及瑞幸的財務數據時,會結合歷史同期的數據,總結出“盈利能力正在不斷增強”的觀點。



      另外,由于財新網的文章重點提到了瑞幸的管理層變更及后續影響,kimi的財報分析也在最后段落增加了相關內容,讓分析的段落格式和財新的內容基本保持一致。



      客觀來說,加入了財新網的關鍵詞后的確能提高整篇財報的可讀性,特別是部分段落融入了財新網的觀點后,讓文章內容更加豐滿,能幫助財經小白更容易看穿冷冰冰數字背后的深意。

      只是,依然尷尬的點是,調整提示詞后的財報分析,只有最開始的一段數據來源是財新網,后續內容的數據依然是來自第三方網站,理想中的“財新網為kimi背書”的作用有限

      特別是如果不添加提示詞,kimi大概率不會主動抓取財新網的內容作為數據來源,這對用戶的學習成本就有點高了。而且哪怕添加了專門的提示詞后來自財新的內容也不多,這毫無疑問會削弱kimi在財經這一垂直領域的“專業”印象。

      再者,對比kimi輸出的內容和財新原版的內容,kimi更多只在做提取部分內容進行總結、加工的工作,從內容專業度、權威性來考慮,可能還不如直接看財新網的報道更加簡單直接。

      不過考慮到想看財新網的全部內容需要付費訂閱,或者kimi的意義就在于作為一個免費渠道看財新網的付費新聞?

      但財新網自身的價值就在于付費訂閱業務,于情于理都不可能答應的,而Kimi的最終目的肯定也不止于此。

      所以目前看來kimi看似和財新是“強強聯合”,但根本沒有發揮出這次合作應有的價值。

      Kimi的根本問題在于,即便有權威媒體作為信源,但依然沒有能力在AI生成方面結合數據生成獨特的、有價值的答案來。

      這里再淺淺對比一下DeepSeek R1,同樣的“分析一下瑞幸的最新財報”提示詞,DeepSeek給出的財報分析十分詳細,除了常規的財務表現、門店表現、成本和市場戰略等數據外,還主動提到了董事會調整、股權結構變化的關鍵信息。

      最后的瑞幸財報所體現的風險和未來展望,更是kimi的財報分析中沒有的。



      在分析的細致程度上也是DeepSeek更勝一籌。比如在分析成本壓力時,DeepSeek會提到和咖啡豆的成本上漲有關,而kimi只用一句“成本有所上升”簡單帶過。



      你看,不需要接入專業、權威信源的DeepSeek,照樣能輸出和kimi不相伯仲的內容來。

      你很難說kimi選擇的這條路線沒意義,但kimi的阿喀琉斯之踵,依然是大模型性能。



      算力是一切

      引用優質數據源,只是對付AI幻覺、提升體驗最基礎的第一步。除此之外還需要更先進的LLM、匹配更高算力、更強大算法并對內容進行審核檢驗等,多個步驟協同進化,提升大模型的整體性能,才能將AI幻覺降到最低。

      所以你可以看到哪怕DeepSeek沒有像kimi和專業的數據源合作,也能提供更優秀的內容,這背后是DeepSeek在LLM層面、算力/算法層面全面領先的證據。

      Kimi和DeepSeek模型能力的差距,已經是引入權威信源都無法彌補的了。

      同時這也揭露了當前AI工具領域的一個殘酷事實:算力就是一切。

      大公司或技術領先公司,能拿到更多算力、能更高效運用算力、能更好的發揮算法優勢,最終訓練出更加先進、聰明的大模型,模型能力的差距能抹平一切“彎道超車”的手段。

      “力大磚飛”,可能才是AI的唯一出路。

      其實在測試之前,我對kimi還是保有很高期待的。眾所周知財經問題對數據的準確性非常高,一些事實判斷也需要非常高的專業度,這些都是使用AI工具咨詢財經問題時最怕出現幻覺的痛點。

      本以為kimi和財新的合作是一次顛覆,但至少目前看來,kimi想要開辟出一條全新的道路還“任重道遠”。

      或許,AI幻覺問題還是只能交給萬眾期待的DeepSeek R2來解決了?

      聲明:個人原創,僅供參考

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      軍改員額壓減背景下,陸軍仍下設7個副戰區級、16個正軍級單位

      軍改員額壓減背景下,陸軍仍下設7個副戰區級、16個正軍級單位

      音樂時光的娛樂
      2026-01-26 11:12:19
      漢武帝玩了一招陽謀,專挑春季發兵打匈奴,致使女人流產人口銳減

      漢武帝玩了一招陽謀,專挑春季發兵打匈奴,致使女人流產人口銳減

      掠影后有感
      2026-01-25 11:33:06
      朝鮮“新星女將軍”金主愛:下一代領導者?她頻頻露面原因為何?

      朝鮮“新星女將軍”金主愛:下一代領導者?她頻頻露面原因為何?

      洞鑒歷史
      2024-04-24 15:10:54
      隱忍24年,陳婷終于撕下完美偽裝,她給所有“已婚女人”上了一課

      隱忍24年,陳婷終于撕下完美偽裝,她給所有“已婚女人”上了一課

      瓜汁橘長Dr
      2025-12-30 17:03:39
      豪華私人飛機在暴風雪中強行起飛失敗,7人死亡

      豪華私人飛機在暴風雪中強行起飛失敗,7人死亡

      大洛杉磯LA
      2026-01-27 04:05:45
      惡魔繼母終于被槍決!此前身份被扒,臨死一句話,讓生母痛心

      惡魔繼母終于被槍決!此前身份被扒,臨死一句話,讓生母痛心

      奇思妙想草葉君
      2026-01-26 00:39:39
      太頂了!明明什么都沒露,卻性感得要命!

      太頂了!明明什么都沒露,卻性感得要命!

      貴圈真亂
      2025-12-20 12:02:06
      中國財政供養人員達6846萬?結構失衡才是財政壓力的核心

      中國財政供養人員達6846萬?結構失衡才是財政壓力的核心

      流蘇晚晴
      2025-12-04 19:27:08
      沙特聯最新積分戰報 C羅中框利雅得勝利小勝 差榜首5分重回前2

      沙特聯最新積分戰報 C羅中框利雅得勝利小勝 差榜首5分重回前2

      狂言體育
      2026-01-27 07:39:36
      青木率99%,高市早苗樂得連喊3聲“萬歲”,麻生:中方不足畏懼

      青木率99%,高市早苗樂得連喊3聲“萬歲”,麻生:中方不足畏懼

      通文知史
      2026-01-25 18:55:03
      果然被我猜中了!美國總統突然宣布!

      果然被我猜中了!美國總統突然宣布!

      達文西看世界
      2026-01-26 20:21:32
      12投10鐵,被高詩巖打崩心態!球迷:知道你為啥進不了國家隊了吧

      12投10鐵,被高詩巖打崩心態!球迷:知道你為啥進不了國家隊了吧

      弄月公子
      2026-01-26 10:43:13
      確實改了!博主在探西貝后發現菜品降價,上菜速度也變慢了

      確實改了!博主在探西貝后發現菜品降價,上菜速度也變慢了

      映射生活的身影
      2026-01-25 17:51:07
      尹建業,被免職

      尹建業,被免職

      新京報政事兒
      2026-01-26 12:23:24
      吉林省即將大幅升溫,最高溫有望沖到零上

      吉林省即將大幅升溫,最高溫有望沖到零上

      櫓訊
      2026-01-26 16:05:36
      李煜至死沒想通:最該聯手的錢弘俶,為何捅他一刀?

      李煜至死沒想通:最該聯手的錢弘俶,為何捅他一刀?

      愛歷史
      2026-01-25 11:25:36
      美國華人直言:中國手機掃碼支付是最不智能的發明!

      美國華人直言:中國手機掃碼支付是最不智能的發明!

      阿傖說事
      2026-01-20 12:53:01
      楊冪不愧是大冪冪!真的挺大的,讓人血脈僨張,難怪有些人接受不了

      楊冪不愧是大冪冪!真的挺大的,讓人血脈僨張,難怪有些人接受不了

      八星人
      2026-01-21 09:25:57
      172:233!日本新首相人選出爐,高市開始豪賭,最后三種可能性

      172:233!日本新首相人選出爐,高市開始豪賭,最后三種可能性

      時時有聊
      2026-01-25 21:11:46
      1958年,李達和毛澤東吵架,李達怒言:你腦子發熱,高燒到39度了

      1958年,李達和毛澤東吵架,李達怒言:你腦子發熱,高燒到39度了

      元哥說歷史
      2026-01-23 09:30:03
      2026-01-27 08:32:49
      藍字計劃 incentive-icons
      藍字計劃
      記錄智能時代的每一次浪潮!前沿科技捕手,AI產品深度洞察。
      211文章數 3875關注度
      往期回顧 全部

      科技要聞

      理想開始關店“過冬”,否認“百家”規模

      頭條要聞

      上海一女子嫌風水不好 屢次掰歪小區兩塊反光鏡

      頭條要聞

      上海一女子嫌風水不好 屢次掰歪小區兩塊反光鏡

      體育要聞

      叛逆的大公子,要砸了貝克漢姆這塊招牌

      娛樂要聞

      張雨綺被抵制成功!遼視春晚已將她除名

      財經要聞

      從美式斬殺線看中國社會的制度韌性構建

      汽車要聞

      賓利第四臺Batur敞篷版發布 解鎖四項定制創新

      態度原創

      家居
      教育
      數碼
      健康
      公開課

      家居要聞

      流韻雅居,讓復雜變純粹

      教育要聞

      舟山嵊泗縣取消

      數碼要聞

      英特爾高管批評AMD Strix Halo效率低 稱高性能應依托獨顯而非大功率核顯

      耳石脫落為何讓人天旋地轉+惡心?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版