![]()
導(dǎo)語(yǔ)
在人工智能與大數(shù)據(jù)浪潮席卷全球的今天,“機(jī)器學(xué)習(xí)”已成為金融投資領(lǐng)域炙手可熱的詞匯之一。很多投資者甚至從業(yè)者不禁都要問(wèn):依靠強(qiáng)大算法的機(jī)器,是否已經(jīng)能夠徹底超越人類分析師,輕松捕捉市場(chǎng)中的超額收益?
日前,北京大學(xué)光華管理學(xué)院金融學(xué)系副教授張英廣與合作者在金融學(xué)頂級(jí)期刊
The Review of Financial Studies上發(fā)表了一項(xiàng)研究。這篇名為《人與機(jī)器學(xué)習(xí)再審視》(Man versus Machine Learning Revisited)的論文, 聚焦機(jī)器學(xué)習(xí)與傳統(tǒng)方法在公司盈利、股票回報(bào)預(yù)測(cè)中的表現(xiàn)之爭(zhēng),通過(guò)對(duì)經(jīng)典研究的系統(tǒng)性復(fù)現(xiàn)與再評(píng)估,得出了一系列具有現(xiàn)實(shí)意義的結(jié)論。 通過(guò)嚴(yán)謹(jǐn)?shù)膶?shí)證檢驗(yàn),修正了學(xué)界對(duì)機(jī)器學(xué)習(xí)在金融預(yù)測(cè)中作用的認(rèn)知,也為業(yè)界理性看待機(jī)器學(xué)習(xí)的應(yīng)用提供了關(guān)鍵參考。
![]()
01
故事的起源,一項(xiàng)引發(fā)巨大反響的研究
故事的起點(diǎn)源于2023年的一項(xiàng)研究。當(dāng)時(shí),有學(xué)者利用隨機(jī)森林(一種流行的機(jī)器學(xué)習(xí)模型)預(yù)測(cè)分析師的盈利預(yù)測(cè)誤差,并據(jù)此構(gòu)建投資策略。結(jié)果顯示,該策略每月能獲得高達(dá)1.54%的超額收益,且統(tǒng)計(jì)顯著性極高。
這一發(fā)現(xiàn)在學(xué)術(shù)界和業(yè)界引起了巨大反響:它似乎證明了機(jī)器學(xué)習(xí)擁有某種天然優(yōu)勢(shì),能夠發(fā)現(xiàn)人類分析師無(wú)法察覺(jué)的市場(chǎng)規(guī)律。這一突破性發(fā)現(xiàn)迅速影響了后續(xù)相關(guān)文獻(xiàn)的研究方向,同時(shí)也引發(fā)了關(guān)于機(jī)器學(xué)習(xí)在金融預(yù)測(cè)中是否更具有優(yōu)勢(shì)的廣泛討論。
02
被忽視的漏洞
然而,科學(xué)的精神在于懷疑與驗(yàn)證。張英廣老師與合作者的研究在對(duì)上述研究進(jìn)行復(fù)現(xiàn)時(shí),完整重建了原研究的預(yù)測(cè)框架、模型設(shè)定與數(shù)據(jù)處理流程,并逐步檢視了其中的變量定義、模型訓(xùn)練方式以及預(yù)測(cè)期限設(shè)置。研究發(fā)現(xiàn),模型中的一個(gè)關(guān)鍵變量——“上一期真實(shí)盈利”,在跨期預(yù)測(cè)場(chǎng)景中被錯(cuò)誤地定義為未來(lái)期尚未可觀測(cè)的盈利信息。
通俗來(lái)說(shuō),這就好比在考試開(kāi)始前,學(xué)生已經(jīng)偷偷看到了試卷的答案,自然能考出高分。這一雖細(xì)微但關(guān)鍵的定義錯(cuò)誤導(dǎo)致了嚴(yán)重的前視偏誤,導(dǎo)致機(jī)器學(xué)習(xí)模型虛假地?fù)碛辛祟A(yù)知未來(lái)的能力,從而極大地高估了其預(yù)測(cè)準(zhǔn)確率和策略收益。
03
修正偏誤后,機(jī)器學(xué)習(xí)優(yōu)勢(shì)大幅縮水
為了還原模型的真實(shí)表現(xiàn),研究團(tuán)隊(duì)剔除了這一前視偏誤,對(duì)模型進(jìn)行了重新檢驗(yàn),結(jié)果出現(xiàn)了根本性變化:原本接近1的夏普比率(衡量投資策略風(fēng)險(xiǎn)調(diào)整后收益的核心指標(biāo),數(shù)值越高代表策略性價(jià)比越高)降至0.15,意味著模型的風(fēng)險(xiǎn)收益比大幅降低,其構(gòu)建的投資策略所產(chǎn)生的超額收益,在統(tǒng)計(jì)和經(jīng)濟(jì)意義上都不再顯著。
更關(guān)鍵的是,修正偏誤后,這款機(jī)器學(xué)習(xí)模型相較于分析師預(yù)測(cè)的優(yōu)勢(shì)大幅縮小,面對(duì)傳統(tǒng)線性模型,也不再有顯著優(yōu)勢(shì)。甚至傳統(tǒng)線性模型在交易收益表現(xiàn)上反而更勝一籌。研究團(tuán)隊(duì)還嘗試了其他機(jī)器學(xué)習(xí)模型及模型組合,均無(wú)法恢復(fù)原研究中高預(yù)測(cè)能力。
此外,研究還對(duì)原研究中關(guān)于市場(chǎng)現(xiàn)象的解釋進(jìn)行了重估,發(fā)現(xiàn)公司股權(quán)增發(fā)、股票收益異象等市場(chǎng)表現(xiàn),并非主要由分析師預(yù)測(cè)偏誤驅(qū)動(dòng),而是更多與企業(yè)實(shí)際盈利水平、基本面屬性相關(guān),這也讓原研究的部分經(jīng)濟(jì)學(xué)解釋的可靠性顯著減弱。
04
為機(jī)器學(xué)習(xí)在金融中的應(yīng)用提供方法論基準(zhǔn)
這項(xiàng)研究并非要否定機(jī)器學(xué)習(xí)的價(jià)值,而是通過(guò)嚴(yán)謹(jǐn)?shù)膹?fù)現(xiàn)與分析強(qiáng)調(diào):任何模型的表現(xiàn)都必須在嚴(yán)格遵守?cái)?shù)據(jù)時(shí)序邏輯、確保特征變量在預(yù)測(cè)時(shí)點(diǎn)可觀測(cè)的前提下進(jìn)行評(píng)價(jià)。
這一研究的價(jià)值也不止于修正一項(xiàng)經(jīng)典研究的結(jié)論,更從方法論、實(shí)證研究和經(jīng)濟(jì)機(jī)制分析三個(gè)層面,為機(jī)器學(xué)習(xí)在金融領(lǐng)域的應(yīng)用劃定了清晰的邊界,提供了重要的實(shí)踐啟示:
首先,該研究對(duì)一項(xiàng)具有廣泛影響的研究進(jìn)行了系統(tǒng)性復(fù)現(xiàn),再次強(qiáng)調(diào)了時(shí)間一致性和數(shù)據(jù)處理細(xì)節(jié)在預(yù)測(cè)建模中的關(guān)鍵作用。機(jī)器學(xué)習(xí)模型對(duì)數(shù)據(jù)高度敏感,變量的定義、數(shù)據(jù)的可觀測(cè)性設(shè)定,直接決定了模型的有效性,這也為后續(xù)金融領(lǐng)域的機(jī)器學(xué)習(xí)研究,建立了更嚴(yán)謹(jǐn)?shù)姆椒ㄒ?guī)范。
第二,研究通過(guò)嚴(yán)謹(jǐn)?shù)膶?shí)證分析表明機(jī)器學(xué)習(xí)模型的表現(xiàn)高度依賴于變量構(gòu)建與變量可觀測(cè)性的設(shè)定,其相對(duì)于傳統(tǒng)方法的信息優(yōu)勢(shì)并非必然存在。這一結(jié)論對(duì)機(jī)器學(xué)習(xí)在違約預(yù)測(cè)、信用評(píng)估、市場(chǎng)微觀結(jié)構(gòu)分析等其他金融場(chǎng)景的應(yīng)用,也具有重要的參考意義。
第三,研究對(duì)分析師預(yù)測(cè)偏誤、上市公司行為與機(jī)器學(xué)習(xí)預(yù)測(cè)之間的因果關(guān)系提出了更為審慎的解釋框架,避免了因模型設(shè)定偏誤所導(dǎo)致的錯(cuò)誤機(jī)制推論被進(jìn)一步放大。
歸根結(jié)底,學(xué)界與業(yè)界也應(yīng)對(duì)機(jī)器學(xué)習(xí)在金融應(yīng)用中的表現(xiàn)持有更合理的預(yù)期。在金融市場(chǎng)日益復(fù)雜、技術(shù)迭代不斷加快的今天,這項(xiàng)研究不僅為機(jī)器學(xué)習(xí)的金融應(yīng)用校準(zhǔn)了方向,也為金融研究的創(chuàng)新發(fā)展提供了重要啟示:無(wú)論技術(shù)如何進(jìn)步,尊重市場(chǎng)規(guī)律、堅(jiān)守研究嚴(yán)謹(jǐn)性,始終是金融研究和實(shí)踐的核心底色。
注:本篇論文的其他作者還包括中央財(cái)經(jīng)大學(xué)金融學(xué)院助理教授朱彥頔、達(dá)特茅斯塔斯克商學(xué)院教授Juhani T. Linnainmaa。
![]()
張英廣,北京大學(xué)光華管理學(xué)院金融學(xué)系副教授、博士生導(dǎo)師。他于2019年在南加州大學(xué)馬歇爾商學(xué)院獲金融學(xué)博士學(xué)位,2011年在加州大學(xué)伯克利分校獲經(jīng)濟(jì)學(xué)和統(tǒng)計(jì)學(xué)榮譽(yù)雙學(xué)士學(xué)位。 張英廣的研究興趣主要為資產(chǎn)定價(jià)、行為金融、金融科技以及中國(guó)金融問(wèn)題。他關(guān)注市場(chǎng)參與者的預(yù)期動(dòng)態(tài)、企業(yè)的預(yù)期管理、以及人工智能和機(jī)器學(xué)習(xí)的在金融應(yīng)用中的價(jià)值與局限。張英廣的研究成果發(fā)表于
Review of Financial Studies, Review of Finance, Pacific-Basin Finance Journal, 《金融研究》,《經(jīng)濟(jì)學(xué)》(季刊),《中國(guó)會(huì)計(jì)評(píng)論》等學(xué)術(shù)期刊。他參與的合作論文曾獲Alpha Letters/CQA 最佳論文獎(jiǎng)、中國(guó)金融前沿學(xué)術(shù)論壇最佳論文獎(jiǎng),并多次應(yīng)邀在美國(guó)金融協(xié)會(huì)年會(huì)(AFA)、美國(guó)經(jīng)濟(jì)學(xué)年會(huì)(AEA)、中國(guó)金融國(guó)際年會(huì)(CICF)宣講論文。
![]()
來(lái)源| 北大光華對(duì)外關(guān)系部
排版| 李珅
編輯 |王小雅
審閱| 塔娜
往期發(fā)布:
什么員工更敢“說(shuō)真話”?丨學(xué)術(shù)光華
文化產(chǎn)品出海的“度”如何拿捏,從好萊塢在華海報(bào)談起 丨學(xué)術(shù)光華
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.