<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      六大國(guó)產(chǎn)大模型,誰(shuí)是最強(qiáng)“金融分析師”?

      0
      分享至



      每當(dāng)我們翻閱財(cái)報(bào)時(shí),可能只想或許關(guān)鍵的財(cái)務(wù)信息,但總是受到財(cái)報(bào)中紛繁復(fù)雜的業(yè)務(wù)表述、冗長(zhǎng)的管理層發(fā)言的干擾,需要耗費(fèi)大量精力去甄別有用的財(cái)務(wù)信息。

      特別是港股美股,國(guó)內(nèi)的大多數(shù)金融軟件,都是基于國(guó)內(nèi)市場(chǎng)財(cái)務(wù)準(zhǔn)則構(gòu)建的信息展示,面對(duì)非標(biāo)財(cái)務(wù)報(bào)表,總會(huì)出現(xiàn)部分摘取科目的錯(cuò)誤。

      進(jìn)入AI大模型時(shí)代之后,這樣的財(cái)務(wù)研究障礙或?qū)⒈还タ恕吘鼓P妥钌瞄L(zhǎng)的,就是語(yǔ)言文字的總結(jié)歸納和數(shù)據(jù)的計(jì)算。

      本文之中,我們即著手對(duì)六大國(guó)內(nèi)主流大模型進(jìn)行評(píng)測(cè),用以探究下其財(cái)報(bào)分析能力,究竟發(fā)展到什么水平,又存在怎樣的問題?

      閱讀提示:鑒于評(píng)測(cè)內(nèi)容過于硬核與篇幅較長(zhǎng),獲取最終評(píng)測(cè)結(jié)果可直接拉至文報(bào)告底部“結(jié)論”部分。

      01 評(píng)測(cè)對(duì)象、邏輯與標(biāo)準(zhǔn)

      評(píng)測(cè)對(duì)象我們挑選了國(guó)內(nèi)主流的6大模型:

      深度求索(DeepSeek-R1)

      阿里千問(Qwen3-235B-A22B)

      騰訊混元(Hunyuan-T1)

      月之暗面(Kimi-K1.5)

      百度文心(ERNIE-X1-Turbo)

      智譜(GLM-4-Plus)

      評(píng)測(cè)邏輯方面,我們采取了“分層進(jìn)階”的問題構(gòu)建,要想成為一個(gè)優(yōu)秀的“AI財(cái)務(wù)分析師”,必須具備多層次的能力。

      因此,我們?cè)O(shè)計(jì)了四個(gè)層級(jí)的測(cè)試,六個(gè)維度的問題,從基礎(chǔ)到高級(jí),逐步深入:

      第一層:基礎(chǔ)信息提取

      AI必須具備的最基本的能力,模型必須能夠準(zhǔn)確讀取財(cái)報(bào)。如果數(shù)據(jù)提取都出現(xiàn)錯(cuò)誤,那么分析將變得毫無(wú)意義。

      第二層:分析計(jì)算與核驗(yàn)

      計(jì)算是模型最擅長(zhǎng)做的事情,但模型還要會(huì)使用數(shù)據(jù),從“閱讀器”成長(zhǎng)為“分析員”。

      第三層:歸納推理與洞察

      模型需要看得更深。要能超越字面信息,發(fā)現(xiàn)文字背后隱藏的邏輯。因此圍繞第三層,我們?cè)O(shè)計(jì)了兩個(gè)考核維度,分別是“高效的歸納和提煉能力”以及“敏銳的風(fēng)險(xiǎn)和情感識(shí)別能力”。

      第四層:戰(zhàn)略總結(jié)與外部知識(shí)整合

      頂尖的分析需要行業(yè)視野,因此要理解企業(yè)的戰(zhàn)略表述。同時(shí)知識(shí)庫(kù)中有限的內(nèi)容是不夠的,模型需要連接外部世界,進(jìn)行橫向比較。為此我們同樣設(shè)計(jì)了兩個(gè)考核維度:“企業(yè)策略與定位的識(shí)別”和“外部信息搜索與整合”。

      標(biāo)準(zhǔn)層面,我們對(duì)每一個(gè)模型都輸入相同的prompt(后文中有詳細(xì)提示詞信息),來(lái)保持規(guī)則的統(tǒng)一。

      02 六項(xiàng)財(cái)務(wù)分析能力橫評(píng)

      1)精準(zhǔn)的數(shù)據(jù)提取能力——模型基礎(chǔ)功底,精準(zhǔn)才是王道

      模型能否像一位嚴(yán)謹(jǐn)?shù)臅?huì)計(jì)師,從PDF財(cái)報(bào)中分毫不差地提取關(guān)鍵財(cái)務(wù)數(shù)據(jù)、特定費(fèi)用項(xiàng)目以及管理層提到的業(yè)務(wù)成就。此項(xiàng)能力的表現(xiàn),直接決定了后續(xù)所有分析的可靠性。我們將重點(diǎn)考察其準(zhǔn)確率和穩(wěn)定性。

      Prompt

      Test1.1:請(qǐng)根據(jù)提供的“美團(tuán)-2025年第1季度”財(cái)務(wù)報(bào)告,提取以下關(guān)鍵財(cái)務(wù)數(shù)據(jù),以表格形式返回結(jié)果:1.營(yíng)業(yè)總收入;2.營(yíng)業(yè)成本;3.凈利潤(rùn)。

      Test1.2:請(qǐng)找出并列出以下費(fèi)用項(xiàng)目的具體金額,以表格形式返回結(jié)果:1.研發(fā)費(fèi)用;2.銷售及市場(chǎng)推廣費(fèi)用。

      Test1.3:請(qǐng)仔細(xì)閱讀“美團(tuán)-2025年第1季度”財(cái)務(wù)報(bào)告中的“業(yè)務(wù)回顧及展望”部分,總結(jié)出管理層提到的本季度最重要的三個(gè)業(yè)務(wù)亮點(diǎn)或成就。|

      評(píng)測(cè)結(jié)論:

      本文評(píng)測(cè)的所有模型都順利完成了指定核心財(cái)務(wù)數(shù)據(jù)和特定項(xiàng)目費(fèi)用的提取。

      其中,ERNIE-X1-Turbo、Hunyuan-T1、Kimi-K1.5和Qwen3-235B-A22B,還貼心地將財(cái)報(bào)中的單位由千元轉(zhuǎn)變?yōu)閮|元,更加貼合用戶習(xí)慣。

      對(duì)于非財(cái)務(wù)關(guān)鍵信息,模型的聚焦點(diǎn)則略有不同,但大多集中于核心本地商業(yè)收入和利潤(rùn)的強(qiáng)勁增長(zhǎng)、閃購(gòu)和即時(shí)零售業(yè)務(wù)的快速發(fā)展、餐飲外賣業(yè)務(wù)的持續(xù)優(yōu)化以及騎手權(quán)益保障體系的升級(jí)等方面。

      2)嚴(yán)謹(jǐn)?shù)挠?jì)算與核驗(yàn)?zāi)芰Α恢粫?huì)計(jì)數(shù),更要會(huì)解釋

      在提取數(shù)據(jù)后,模型能否扮演“審計(jì)員”的角色?這包括兩個(gè)層面:

      一是能否運(yùn)用正確的公式,基于提取的數(shù)據(jù)計(jì)算出毛利率、流動(dòng)比率等核心財(cái)務(wù)指標(biāo)并解釋其含義;

      二是在面對(duì)管理層的業(yè)績(jī)聲明時(shí),能否獨(dú)立進(jìn)行數(shù)據(jù)核查,判斷其真?zhèn)巍_@是對(duì)模型邏輯推理和“批判性思維”的直接考驗(yàn)。

      Prompt:

      Test2.1:根據(jù)“美團(tuán)-2025年第1季度”財(cái)務(wù)報(bào)告中的數(shù)據(jù),計(jì)算該公司的毛利率。請(qǐng)列出計(jì)算公式、使用的具體數(shù)據(jù),并解釋這個(gè)毛利率數(shù)值反映了公司怎樣的盈利能力。

      Test2.2:請(qǐng)使用“美團(tuán)-2025年第1季度”財(cái)務(wù)報(bào)告中的資產(chǎn)負(fù)債表數(shù)據(jù),計(jì)算該公司的流動(dòng)比率。請(qǐng)說(shuō)明你使用了哪些數(shù)據(jù)進(jìn)行計(jì)算,并解釋該比率所揭示的公司短期償債風(fēng)險(xiǎn)。

      Test2.3:管理層在報(bào)告中聲稱“核心本地商業(yè)的經(jīng)營(yíng)利潤(rùn)率同比提升3.2個(gè)百分點(diǎn)至21.0%”。請(qǐng)根據(jù)財(cái)報(bào)數(shù)據(jù)核實(shí)這一說(shuō)法的準(zhǔn)確性,并說(shuō)明你的判斷依據(jù)。

      評(píng)測(cè)結(jié)論:

      六個(gè)模型中,僅有Kimi-K1.5未能通過這一項(xiàng)測(cè)試

      Kimi-K1.5明明已經(jīng)獲取到正確的營(yíng)業(yè)收入和營(yíng)業(yè)成本,但在計(jì)算時(shí)卻出現(xiàn)錯(cuò)誤,正確答案應(yīng)為37.4477,而該模型得出的答案為37.49。



      圖:Kimi-K1.5計(jì)算毛利率

      與此同時(shí),Kimi-K1.5在計(jì)算流動(dòng)比率時(shí),將“簡(jiǎn)明綜合財(cái)務(wù)狀況表”中的“現(xiàn)金及現(xiàn)金等價(jià)物”錯(cuò)誤識(shí)別為“流動(dòng)資產(chǎn)總額”,導(dǎo)致另一處計(jì)算錯(cuò)誤。



      圖:Kimi-K1.5計(jì)算流動(dòng)比率

      而財(cái)務(wù)比率的解釋,各模型均給出了上述財(cái)務(wù)比率的定義以及短期償債能力穩(wěn)健的結(jié)論

      除此之外,不同模型給出的其他信息也有所不同:

      DeepSeek-R1:美團(tuán)資產(chǎn)結(jié)構(gòu)的優(yōu)勢(shì)、風(fēng)險(xiǎn)揭示和需關(guān)注的隱患;

      ERNIE-X1-Turbo和GLM-4-Plus:未給出其他多余信息;

      Hunyuan-T1:安全邊際充足、資產(chǎn)流動(dòng)性結(jié)構(gòu)優(yōu)勢(shì)、流動(dòng)負(fù)債可控及潛在風(fēng)險(xiǎn)點(diǎn);

      Kimi-K1.5:盈利能力較強(qiáng)、成本控制有效、業(yè)務(wù)結(jié)構(gòu)優(yōu)化等盈利能力反映;

      Qwen3-235B-A22B:盈利能力、成本控制能力的解釋及行業(yè)對(duì)比。

      數(shù)據(jù)核驗(yàn)方面,各模型均正確計(jì)算了2024年和2025年第一季度的經(jīng)營(yíng)利潤(rùn)率驗(yàn)證了提示詞中的給定說(shuō)法

      值得注意的是,DeepSeek-R1還給出了業(yè)務(wù)意義,而Hunyuan-T1則附帶了潛在風(fēng)險(xiǎn)提示。

      3)高效的歸納與提煉能力——從“復(fù)制粘貼”到“提煉精華”

      財(cái)報(bào)信息繁雜,能否為不同受眾提煉核心要點(diǎn),是衡量AI效率的關(guān)鍵。

      本項(xiàng)能力考察模型能否像一位資深編輯,既能為普通投資者撰寫一份通俗易懂的200字業(yè)績(jī)摘要,也能精準(zhǔn)概括出管理層在“討論與分析”部分提到的主要挑戰(zhàn)。

      我們將評(píng)估其摘要的準(zhǔn)確性、完整性和信息價(jià)值。

      Prompt:

      Test3.1:請(qǐng)面向一位普通的國(guó)內(nèi)投資者,用不超過200字,總結(jié)這份財(cái)務(wù)報(bào)告最重要的三個(gè)結(jié)論。

      Test3.2:請(qǐng)總結(jié)“管理層討論及分析”部分提到的公司面臨的主要挑戰(zhàn)。

      評(píng)測(cè)結(jié)論:

      整體表現(xiàn)摘要方面,各模型都能夠準(zhǔn)確地以數(shù)據(jù)為支撐給出正確結(jié)論

      其中,DeepSeek-R1、Hunyuan-T1、Kimi-K1.5和Qwen3-235B-A22B能夠?qū)⒔Y(jié)論分條進(jìn)行羅列,結(jié)構(gòu)層次相比另外兩個(gè)模型將結(jié)論放到一段話中更加清晰。

      DeepSeek-R1還展現(xiàn)出了另外一個(gè)亮點(diǎn),即使用“賺錢能力飆升”、“家底厚抗風(fēng)險(xiǎn)”等通俗易懂的語(yǔ)言風(fēng)格

      特定章節(jié)摘要方面,各模型都展現(xiàn)出了良好的信息定位準(zhǔn)確性和歸納與條理性,能夠準(zhǔn)確定位原文位置對(duì)公司面臨的挑戰(zhàn)進(jìn)行邏輯歸納與分類,以清晰的分點(diǎn)闡述形式呈現(xiàn),具備較強(qiáng)的可讀性。

      其中,DeepSeek-R1、ERNIE-X1-Turbo和Qwen3-235B-A22B都在回答過程中展示了相關(guān)數(shù)據(jù),使其結(jié)論更具說(shuō)服力,而DeepSeek-R1還額外標(biāo)注了信息來(lái)源。

      對(duì)于信息全面性,GLM-4-Plus雖然給出了多種答案,但由于缺乏具體依據(jù)支撐,內(nèi)容略顯空洞;而ERNIE-X1-Turbo則一如既往地延續(xù)了簡(jiǎn)練的回答風(fēng)格。

      4)敏銳的風(fēng)險(xiǎn)與情感識(shí)別能力——讀懂字里行間的“弦外之音”

      頂尖的分析師能“讀出字里行間的意思”。我們通過本項(xiàng)能力,測(cè)試模型是否具備這種高級(jí)認(rèn)知能力。

      它能否識(shí)別出財(cái)報(bào)中未明說(shuō)但隱含的業(yè)務(wù)風(fēng)險(xiǎn);能否綜合業(yè)績(jī)和管理層措辭,對(duì)整份報(bào)告?zhèn)鬟f出的整體情緒基調(diào)(樂觀、謹(jǐn)慎、悲觀)做出準(zhǔn)確判斷。

      Prompt

      Test4.1:財(cái)報(bào)是否暗示了任何其他潛在的業(yè)務(wù)風(fēng)險(xiǎn)?請(qǐng)舉例說(shuō)明。

      Test4.2:綜合整份財(cái)報(bào)的業(yè)績(jī)數(shù)據(jù)和管理層的措辭,你認(rèn)為這份報(bào)告向投資者傳遞的整體基調(diào)是樂觀、謹(jǐn)慎還是悲觀?請(qǐng)給出你的判斷,并提供至少2個(gè)理由。

      評(píng)測(cè)結(jié)論:

      在分析潛在業(yè)務(wù)風(fēng)險(xiǎn)時(shí),除Kimi-K1.5以外的模型都能夠根據(jù)財(cái)報(bào)中提及的說(shuō)法分條列舉潛在風(fēng)險(xiǎn)

      Kimi-K1.5則從宏觀角度出發(fā),根據(jù)美團(tuán)的主營(yíng)業(yè)務(wù)進(jìn)行分析,并未注重于財(cái)報(bào)中隱藏的信息。



      圖:Kimi-K1.5分析潛在業(yè)務(wù)風(fēng)險(xiǎn)

      此外,Kimi-K1.5在最初的回答中一次給出了50種風(fēng)險(xiǎn),令人疑惑。

      DeepSeek-R1、Hunyuan-T1和Qwen3-235B-A22B給出的回答最為清晰,使用固定的結(jié)構(gòu)并明確給出信息來(lái)源,令用戶一目了然,快速明確風(fēng)險(xiǎn)。

      DeepSeek-R1首先按照“風(fēng)險(xiǎn)種類”-“驅(qū)動(dòng)事件”-“財(cái)報(bào)原文”-“風(fēng)險(xiǎn)點(diǎn)”的結(jié)構(gòu)進(jìn)行闡述,此后給出財(cái)報(bào)中未明示但可推導(dǎo)的風(fēng)險(xiǎn),最后給出結(jié)論和針對(duì)投資者的建議。





      圖:DeepSeek-R1分析潛在業(yè)務(wù)風(fēng)險(xiǎn)

      Hunyuan-T1和Qwen3-235B-A22B也采用了類似的回答結(jié)構(gòu),在準(zhǔn)確把握核心矛盾的同時(shí)展現(xiàn)了強(qiáng)大的推理能力

      ERNIE-X1-Turbo和GLM-4-Plus采取了分段論述的方式,在每段中闡述了風(fēng)險(xiǎn)的產(chǎn)生原因和財(cái)報(bào)中的論據(jù)出處,內(nèi)容完整但擴(kuò)展內(nèi)容不夠豐富,結(jié)構(gòu)相比上述三個(gè)模型不夠清晰。

      整體情緒判斷任務(wù)中,六個(gè)模型給出的整體基調(diào)均為樂觀

      但DeepSeek-R1、Hunyuan-T1和Qwen3-235B-A22B都直接或間接采用了“謹(jǐn)慎樂觀”的說(shuō)法。

      GLM-4-Plus和Kimi-K1.5雖然識(shí)別出了報(bào)告中提及的風(fēng)險(xiǎn)和挑戰(zhàn),但認(rèn)為瑕不掩瑜。

      ERNIE-X1-Turbo的回答中則沒有提到任何悲觀因素。

      由此可知,DeepSeek-R1、Hunyuan-T1和Qwen3-235B-A22B通讀全文并把控整體情緒的同時(shí),對(duì)于細(xì)節(jié)的理解和大局觀都要略勝一籌,具備兼顧“事實(shí)”和“情感”的平衡能力,其結(jié)論也更加立體和可信。

      5)企業(yè)策略與定位推斷能力——需要“知識(shí)儲(chǔ)備”的綜合題

      這是從數(shù)據(jù)到洞察的飛躍。

      模型能否結(jié)合財(cái)報(bào)數(shù)據(jù)和自身知識(shí),扮演“戰(zhàn)略分析師”,識(shí)別競(jìng)爭(zhēng)格局;我們要求模型基于毛利率和研發(fā)投入等數(shù)據(jù),推斷公司的競(jìng)爭(zhēng)策略(是成本領(lǐng)先還是技術(shù)驅(qū)動(dòng)),并綜合各項(xiàng)信息,評(píng)估其在行業(yè)中的市場(chǎng)地位(是領(lǐng)導(dǎo)者還是挑戰(zhàn)者)。

      Prompt:

      Test5.1:請(qǐng)根據(jù)“美團(tuán)-2025年第1季度”財(cái)務(wù)報(bào)告中對(duì)其業(yè)務(wù)的描述,并結(jié)合你的通用知識(shí),列出該公司所在行業(yè)的主要競(jìng)爭(zhēng)對(duì)手(至少兩家)。

      Test5.2:請(qǐng)分析報(bào)告中的“毛利率(Gross Margin)”和“研發(fā)費(fèi)用占收入的比例”。基于這兩個(gè)數(shù)據(jù),并與你所知的該行業(yè)典型水平進(jìn)行比較,推斷該公司更可能采取哪種競(jìng)爭(zhēng)策略:是“成本領(lǐng)先”策略(追求高效率和低成本),還是“差異化/技術(shù)驅(qū)動(dòng)”策略(追求產(chǎn)品獨(dú)特性和高附加值)?請(qǐng)說(shuō)明你的推理過程。

      Test5.3:綜合整份財(cái)務(wù)報(bào)告(包括其收入增長(zhǎng)率、利潤(rùn)率水平以及管理層的討論),請(qǐng)對(duì)該公司在本行業(yè)中的市場(chǎng)地位給出一個(gè)綜合評(píng)估。你認(rèn)為它更接近于“行業(yè)領(lǐng)導(dǎo)者”、“強(qiáng)有力的挑戰(zhàn)者”,還是一個(gè)“特定的利基市場(chǎng)參與者”?請(qǐng)?zhí)峁┲辽賰牲c(diǎn)證據(jù)來(lái)支持你的結(jié)論:

      1.一個(gè)來(lái)自財(cái)務(wù)數(shù)據(jù)(例如:高于/低于行業(yè)平均的利潤(rùn)率或增長(zhǎng)率)。

      2.一個(gè)來(lái)自“管理層討論與分析”部分的定性描述。

      評(píng)測(cè)結(jié)論:

      在識(shí)別競(jìng)爭(zhēng)格局時(shí),本文測(cè)試的六個(gè)模型均能準(zhǔn)確列出當(dāng)前市場(chǎng)中最主要的競(jìng)爭(zhēng)對(duì)手(餓了么、抖音本地生活服務(wù)和京東到家),并將具體業(yè)務(wù)線進(jìn)行對(duì)應(yīng)。

      證明AI具備將財(cái)報(bào)中的業(yè)務(wù)描述與知識(shí)庫(kù)中的現(xiàn)實(shí)世界商業(yè)實(shí)體進(jìn)行精準(zhǔn)匹配

      不過,各模型給出的回答思路有所不同。

      DeepSeek-R1、GLM-4-Plus、Hunyuan-T1和Qwen3-235B-A22B先列出競(jìng)爭(zhēng)對(duì)手,再給出其競(jìng)爭(zhēng)領(lǐng)域和依據(jù)。

      ERNIE-X1-Turbo和Kimi-K1.5先列出競(jìng)爭(zhēng)領(lǐng)域,再給出主要競(jìng)爭(zhēng)對(duì)手和競(jìng)爭(zhēng)關(guān)系。

      其中,DeepSeek-R1和Hunyuan-T1在給出依據(jù)時(shí)引用了財(cái)報(bào)原文,使答案更具備說(shuō)服力;其他模型則更多根據(jù)通用知識(shí)庫(kù)中的內(nèi)容進(jìn)行回答。

      此外,Qwen3-235B-A22B和Kimi-K1.5分別注意到國(guó)際競(jìng)爭(zhēng)對(duì)手和自有外賣系統(tǒng),是意外的亮點(diǎn)。

      推斷競(jìng)爭(zhēng)策略則是本次測(cè)評(píng)中難度最高的一項(xiàng)任務(wù),需要AI模型完成“數(shù)據(jù)提取”-“外部知識(shí)比對(duì)”-“商業(yè)理論應(yīng)用”-“邏輯推理”的完整閉環(huán)。



      數(shù)據(jù)提取方面,GLM-4-Plus使用了假設(shè)數(shù)據(jù),從而導(dǎo)致后續(xù)分析中使用的毛利率數(shù)據(jù)錯(cuò)誤,其結(jié)果不具備參考性;而其余模型都提取到了正確的數(shù)據(jù)



      圖:GLM-4-Plus推斷競(jìng)爭(zhēng)策略

      在推理分析過程中,盡管行業(yè)平均數(shù)據(jù)不具備權(quán)威性,但除了ERNIE-X1-Turbo外的模型均以行業(yè)平均數(shù)據(jù)作為參照物進(jìn)行了外部知識(shí)比對(duì),有效提高了分析質(zhì)量。



      圖:ERNIE-X1-Turbo推斷競(jìng)爭(zhēng)策略

      由于各模型的關(guān)注點(diǎn)有所不同,ERNIE-X1-Turbo、Hunyuan-T1和Kimi-K1.5能夠基于上述比較和結(jié)論,生成一個(gè)“nuanced”的結(jié)論,而非從提示詞中進(jìn)行二選一。

      至于對(duì)市場(chǎng)地位的評(píng)估,六個(gè)模型通過引用管理層討論原文、定量分析和定性分析等方式,全部給出了“行業(yè)領(lǐng)導(dǎo)者”的判斷,論證過程嚴(yán)密,具備較高的可信度,且模型之間基本不存在能力差異。

      6)融合外部知識(shí)的聯(lián)網(wǎng)比對(duì)能力——能力邊界的拓展

      最后,我們打破單一文檔的限制,考察模型連接現(xiàn)實(shí)世界的能力。

      它能否通過聯(lián)網(wǎng)搜索功能,獲取競(jìng)爭(zhēng)對(duì)手同一時(shí)期的財(cái)務(wù)數(shù)據(jù)(如毛利率、流動(dòng)比率等),并進(jìn)行準(zhǔn)確的橫向比較。

      Prompt:

      Test6.1:2025年第1季度,相比京東、阿里、百度和快手,美團(tuán)的銷售毛利率這一指標(biāo)排名如何?可通過聯(lián)網(wǎng)搜索獲取所需數(shù)據(jù),但必須保證數(shù)據(jù)的準(zhǔn)確性,禁止編造或假設(shè)數(shù)據(jù),禁止使用虛假數(shù)據(jù)。

      Test6.2:2025年第1季度,相比京東、阿里、百度和快手,美團(tuán)的流動(dòng)比率這一指標(biāo)排名如何?可通過聯(lián)網(wǎng)搜索獲取所需數(shù)據(jù),但必須保證數(shù)據(jù)的準(zhǔn)確性,禁止編造或假設(shè)數(shù)據(jù),禁止使用虛假數(shù)據(jù).

      Test6.3:2025年第1季度,相比京東、阿里、百度和快手,美團(tuán)的資產(chǎn)負(fù)債率這一指標(biāo)排名如何?可通過聯(lián)網(wǎng)搜索獲取所需數(shù)據(jù),但必須保證數(shù)據(jù)的準(zhǔn)確性,禁止編造或假設(shè)數(shù)據(jù),禁止使用虛假數(shù)據(jù)。

      此項(xiàng)能力直接關(guān)系到AI作為智能助手的實(shí)用價(jià)值。

      評(píng)測(cè)結(jié)論:

      本次評(píng)測(cè)的六個(gè)模型對(duì)于聯(lián)網(wǎng)信息的搜集能力均不理想



      對(duì)于銷售毛利率,尚有DeepSeek-R1、ERNIE-X1-Turbo和Hunyuan-T1能夠獲取五家公司的全部正確數(shù)據(jù)。

      而流動(dòng)比率和資產(chǎn)負(fù)債率則沒有任何一個(gè)模型能夠獲取全部正確數(shù)據(jù)。

      DeepSeek-R1和ERNIE-X1-Turbo的信息搜索能力相對(duì)最強(qiáng),均獲得10項(xiàng)以上正確數(shù)據(jù),前者不存在編造數(shù)據(jù)的情況,后者出現(xiàn)一次錯(cuò)誤數(shù)據(jù);

      Kimi-K1.5和Qwen3-235B-A22B的信息正確率位于中等水平,在計(jì)算流動(dòng)比率和資產(chǎn)負(fù)債率時(shí),存在一定未獲取到數(shù)據(jù)或編造數(shù)據(jù)的情況;

      GLM-4-Plus和HunyuanT1表現(xiàn)較差,尤其是在計(jì)算資產(chǎn)負(fù)債率時(shí),頻繁出現(xiàn)編造數(shù)據(jù)的情況。

      GLM-4-Plus甚至只搜索到了一個(gè)與問題毫無(wú)聯(lián)系的網(wǎng)頁(yè)并編造了5個(gè)虛假數(shù)據(jù),給用戶帶來(lái)極大困擾。

      綜上所述,由于AI大模型在聯(lián)網(wǎng)搜索信息時(shí)幾乎不會(huì)去權(quán)威性數(shù)據(jù)渠道進(jìn)行查詢,而互聯(lián)網(wǎng)中又充斥著大量的虛假錯(cuò)誤信息。

      AI在這一領(lǐng)域還有很大的提升空間,在分析財(cái)報(bào)時(shí)會(huì)導(dǎo)致嚴(yán)重的錯(cuò)誤,因此不建議使用聯(lián)網(wǎng)搜索功能以獲取重要財(cái)務(wù)數(shù)據(jù)

      03 結(jié)論

      為了更加直觀地展現(xiàn)評(píng)測(cè)結(jié)果,我們制作了如下表格:



      在不考慮聯(lián)網(wǎng)信息搜索的情況下:

      對(duì)于專業(yè)的投資者或財(cái)務(wù)分析人士,DeepSeek-R1、Hunyuan-T1和Qwen3-235B-A22B都是值得信賴的“助理”,在提升工作效率的同時(shí),它們還可以提出有價(jià)值的洞察

      對(duì)于普通用戶或?qū)W生,ERNIE-X1-Turbo也是不錯(cuò)的選擇,完全可以勝任快速獲取核心數(shù)據(jù)和基本信息的功能。

      但是,聯(lián)網(wǎng)信息搜索的準(zhǔn)確性對(duì)于各模型來(lái)說(shuō)都是現(xiàn)階段難以跨越的門檻,我們可以接受AI找不到信息,但不能接受AI把假信息當(dāng)真信息回答。

      最后,依舊我們略顯主觀的評(píng)測(cè)標(biāo)準(zhǔn),統(tǒng)計(jì)了六大模型的財(cái)務(wù)分析能力雷達(dá)圖,供大家參考:













      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      關(guān)于楊蘭蘭,終于破解出幾條她的關(guān)鍵信息

      關(guān)于楊蘭蘭,終于破解出幾條她的關(guān)鍵信息

      熱點(diǎn)菌本君
      2025-10-01 17:24:05
      何晴出殯當(dāng)天,曝前夫許亞軍狀態(tài),在美國(guó)與幼子吃飯,緊盯著手機(jī)

      何晴出殯當(dāng)天,曝前夫許亞軍狀態(tài),在美國(guó)與幼子吃飯,緊盯著手機(jī)

      裕豐娛間說(shuō)
      2025-12-16 10:29:32
      美團(tuán)突然急剎,決戰(zhàn)恐將升級(jí)

      美團(tuán)突然急剎,決戰(zhàn)恐將升級(jí)

      ZAKER新聞
      2025-12-16 17:11:31
      誤打誤撞把病治好是啥體驗(yàn)?網(wǎng)友:華佗在世都要甘拜下風(fēng)啊

      誤打誤撞把病治好是啥體驗(yàn)?網(wǎng)友:華佗在世都要甘拜下風(fēng)啊

      帶你感受人間冷暖
      2025-07-21 00:15:06
      “公路之王”跌至15萬(wàn)!連隔音都是多層,長(zhǎng)5米比奧迪A6L舒適!

      “公路之王”跌至15萬(wàn)!連隔音都是多層,長(zhǎng)5米比奧迪A6L舒適!

      西莫的藝術(shù)宮殿
      2025-12-16 13:26:27
      A股:剛剛,大消息傳來(lái),釋放兩個(gè)信號(hào),周三很可能迎來(lái)更大變盤

      A股:剛剛,大消息傳來(lái),釋放兩個(gè)信號(hào),周三很可能迎來(lái)更大變盤

      云鵬敘事
      2025-12-17 00:00:07
      她長(zhǎng)得漂亮演技好,出道26年不溫不火,如今38歲卻還是單身

      她長(zhǎng)得漂亮演技好,出道26年不溫不火,如今38歲卻還是單身

      鋒哥與八卦哥
      2025-12-16 13:03:00
      斯諾克爆大冷!世界冠軍首輪出局,趙心童收退賽大禮,丁俊暉開心

      斯諾克爆大冷!世界冠軍首輪出局,趙心童收退賽大禮,丁俊暉開心

      曹說(shuō)體育
      2025-12-16 14:31:36
      李在明動(dòng)作迅速,中韓開始對(duì)表,石破茂的布局,或被高市毀于一旦

      李在明動(dòng)作迅速,中韓開始對(duì)表,石破茂的布局,或被高市毀于一旦

      通文知史
      2025-12-15 21:40:03
      賴昌星發(fā)妻曾明娜現(xiàn)狀:逃亡10年后回國(guó),守著3000平老宅安靜養(yǎng)老

      賴昌星發(fā)妻曾明娜現(xiàn)狀:逃亡10年后回國(guó),守著3000平老宅安靜養(yǎng)老

      古書記史
      2025-12-12 11:21:38
      “肉車”泛濫,打工人崩潰:為什么路上全是肉車?

      “肉車”泛濫,打工人崩潰:為什么路上全是肉車?

      詩(shī)意世界
      2025-12-14 11:35:43
      東莞一夜市爆火!擠爆了!人人人人人!

      東莞一夜市爆火!擠爆了!人人人人人!

      東莞好生活
      2025-12-16 21:52:44
      面對(duì)上門的上海警察,他從24樓扔下22部手機(jī)和1臺(tái)筆記本電腦

      面對(duì)上門的上海警察,他從24樓扔下22部手機(jī)和1臺(tái)筆記本電腦

      上觀新聞
      2025-12-16 19:37:06
      封關(guān)后,海南炸鍋了。有房子的外地人、當(dāng)?shù)赝林紭烽_了花!

      封關(guān)后,海南炸鍋了。有房子的外地人、當(dāng)?shù)赝林紭烽_了花!

      石辰搞笑日常
      2025-12-03 08:50:12
      美名導(dǎo)父子血案震驚全球!18次戒毒失敗釀弒親慘劇,禁毒任重道遠(yuǎn)

      美名導(dǎo)父子血案震驚全球!18次戒毒失敗釀弒親慘劇,禁毒任重道遠(yuǎn)

      世界王室那些事
      2025-12-16 16:35:01
      特朗普根本勸不住泰國(guó),洪森這才看清楚,中國(guó)的做法才是最正確的

      特朗普根本勸不住泰國(guó),洪森這才看清楚,中國(guó)的做法才是最正確的

      科普100克克
      2025-12-17 01:09:46
      澤連斯基透露結(jié)束俄烏沖突新進(jìn)展!俄副外長(zhǎng):任何情況下都不會(huì)同意在烏克蘭部署北約軍隊(duì)

      澤連斯基透露結(jié)束俄烏沖突新進(jìn)展!俄副外長(zhǎng):任何情況下都不會(huì)同意在烏克蘭部署北約軍隊(duì)

      每日經(jīng)濟(jì)新聞
      2025-12-16 20:32:56
      曝羅志祥已立好遺囑,停藥后反應(yīng)遲鈍,含淚談患病母親看哭網(wǎng)友

      曝羅志祥已立好遺囑,停藥后反應(yīng)遲鈍,含淚談患病母親看哭網(wǎng)友

      心靜物娛
      2025-11-20 14:24:06
      女子莫名“被買”兩張高鐵票,都是售價(jià)3000余元的商務(wù)座,致電客服后成功退票,12306回應(yīng)

      女子莫名“被買”兩張高鐵票,都是售價(jià)3000余元的商務(wù)座,致電客服后成功退票,12306回應(yīng)

      極目新聞
      2025-12-16 21:19:22
      全國(guó)“交警”集體改名!背后深意很多人沒看懂

      全國(guó)“交警”集體改名!背后深意很多人沒看懂

      李云飛Afey
      2025-12-15 20:15:17
      2025-12-17 03:19:00
      錦緞研究院 incentive-icons
      錦緞研究院
      專注上市公司價(jià)值發(fā)現(xiàn)與傳播
      2414文章數(shù) 10783關(guān)注度
      往期回顧 全部

      財(cái)經(jīng)要聞

      浙金中心暴雷始末:祥源控股設(shè)計(jì)的騙局?

      頭條要聞

      美國(guó)向?yàn)跸伦詈笸海含F(xiàn)在不接受 以后沒那么慷慨了

      頭條要聞

      美國(guó)向?yàn)跸伦詈笸海含F(xiàn)在不接受 以后沒那么慷慨了

      體育要聞

      楊瀚森18+10首次兩雙 關(guān)鍵攻防統(tǒng)治G聯(lián)賽

      娛樂要聞

      《雙軌》遭網(wǎng)友舉報(bào),稱劇情三觀不正

      科技要聞

      360:玉紅惡意詆毀周鴻祎 將追究其法律責(zé)任

      汽車要聞

      打造全域安全2.0,吉利的新“長(zhǎng)征”

      態(tài)度原創(chuàng)

      游戲
      本地
      教育
      房產(chǎn)
      健康

      德瑪西亞杯:完全沒法打,LNG輕松橫掃FRK,太輕松了

      本地新聞

      云游安徽|尋跡六安,三處舊址回望烽火歲月

      教育要聞

      初三市一模你怎么看?填填你的看法!

      房產(chǎn)要聞

      6.66億摘地,海南封關(guān)大動(dòng)作,千畝海澄新城震撼登場(chǎng)

      這些新療法,讓化療不再那么痛苦

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 日韩 欧美 亚洲 一区二区| 四平市| 性无码一区二区三区在线观看| 一区一区三区产品乱码| 内地自拍三级在线观看| 日韩色区| 国精产品一区一区三区有限公司杨| 色综合久久88色综合天天| 被灌满精子的波多野结衣 | 甘孜县| 性色av蜜臀av色欲av| 精品一区二区ww| 狠狠躁天天躁中文字幕无码| 91视频专区| 性xxxx欧美老妇胖老太性多毛| 国产精品一区二区三乱码| 人人玩人人添人人澡超碰| 色中色AV| 中文字幕另类综合| 亚洲色成人www永久网站| 精品无码国产不卡在线观看| 亚洲天堂中文字幕| 狼人久久综合| 欧美性受xxxx黑人猛交| 国产精品999| 无码中文人妻| 亚洲中文字幕国产| 日本免费一区二区三区| 国产jjizz女人多水| 东京热一本无码av| 日本高清一区二区三| 精品人妻一区二区三区四区视频不卡| 日韩欧美亚洲| 哈密市| 亚卅精品| 伊人免费在线| 久久精品亚洲| 碰碰免费视频| 无码伊人66久久大杳蕉网站谷歌 | 久久蜜臂| 亚洲无码VS|