![]()
每次NFL比賽的每一次對抗都會(huì)產(chǎn)生大量的物理數(shù)據(jù)。22名球員在幾分之一秒內(nèi)加速、碰撞并改變方向,而橄欖球則在有序的混亂中劃出一道軌跡。
然而在這項(xiàng)運(yùn)動(dòng)的大部分歷史中,許多復(fù)雜性都未被測量。NFL新一代數(shù)據(jù)分析系統(tǒng)的研究與分析高級經(jīng)理Mike Band說:"橄欖球在100多年里一直是一項(xiàng)依賴基礎(chǔ)數(shù)據(jù)的運(yùn)動(dòng):你有碼數(shù)、達(dá)陣、擒抱......"
這些數(shù)字只能捕捉到球場上實(shí)際發(fā)生事情的一小部分。教練們反復(fù)觀看比賽錄像并做出有根據(jù)的猜測。球迷們在看臺(tái)和沙發(fā)上爭論不休。裁判偶爾會(huì)根據(jù)部分甚至受阻的視野做出主觀判斷。NFL橄欖球數(shù)據(jù)與分析高級總監(jiān)Mike Lopez說:"看著基礎(chǔ)數(shù)據(jù)統(tǒng)計(jì),你甚至不知道某次進(jìn)攻中哪22名球員在場上。"
2015年,NFL決定通過推出新一代數(shù)據(jù)分析系統(tǒng)來擴(kuò)展基礎(chǔ)數(shù)據(jù)統(tǒng)計(jì)。RFID芯片被植入每套護(hù)肩墊和橄欖球內(nèi)部,每個(gè)體育場周圍安裝了20多個(gè)超寬帶接收器。該系統(tǒng)開始流式傳輸所有22名球員的坐標(biāo)(每秒10次)和球的坐標(biāo)(每秒25次)。NFL首次捕獲到每次進(jìn)攻每個(gè)時(shí)刻的全面球員位置數(shù)據(jù),精確到幾英寸。
起初,每個(gè)俱樂部只能訪問自己的追蹤數(shù)據(jù)。這種情況在2018年發(fā)生了變化,當(dāng)時(shí)各球隊(duì)獲得了全聯(lián)盟范圍的訪問權(quán)限,讓教練、球探和分析師站在了共同的分析基礎(chǔ)上。同年,聯(lián)盟正式深化了與AWS的合作關(guān)系,標(biāo)志著新一代數(shù)據(jù)分析系統(tǒng)開始從追蹤實(shí)驗(yàn)逐步轉(zhuǎn)變?yōu)镹FL的關(guān)鍵基礎(chǔ)設(shè)施,實(shí)時(shí)轉(zhuǎn)播只是其最顯而易見的表現(xiàn)形式。
如今,新一代數(shù)據(jù)分析系統(tǒng)支撐著整個(gè)聯(lián)盟的決策制定,從俱樂部如何評估球員和設(shè)計(jì)比賽計(jì)劃,到NFL如何研究裁判判罰、球員安全和規(guī)則變更。每支球隊(duì)以及聯(lián)盟的大部分工作現(xiàn)在都依賴于同一個(gè)不斷擴(kuò)展的數(shù)據(jù)支柱。
但它的開始很簡單,Band說:"我們早期的指標(biāo)是容易獲得的成果——球員分離度、速度和傳球時(shí)間——很容易從我們擁有的數(shù)據(jù)中得出。對更復(fù)雜的比賽指標(biāo)建模需要更多努力,這就是AWS介入的地方。"
該合作在2018年提供的第一個(gè)復(fù)雜統(tǒng)計(jì)數(shù)據(jù)是完成概率。它被設(shè)計(jì)用來回答一個(gè)簡單的問題:傳球的難度可以量化嗎?
答案部分來自托管在亞馬遜SageMaker平臺(tái)上的XGBoost機(jī)器學(xué)習(xí)模型。它融合了影響傳球結(jié)果的因素,從四分衛(wèi)壓力到傳球深度、接球手分離度和邊線距離。該模型返回一個(gè)單一的百分比,既捕捉了可能性又反映了難度。Band說:"這成為我們進(jìn)入機(jī)器學(xué)習(xí)的切入點(diǎn)。"
除了SageMaker,NFL的分析工作已經(jīng)擴(kuò)展到AWS工具的廣泛套件。Lopez說,聯(lián)盟橄欖球數(shù)據(jù)分析小組的成員"稱自己為AWS商店"。到2018年,隨著全聯(lián)盟訪問權(quán)限的到位和AWS的機(jī)器學(xué)習(xí)管道運(yùn)行,新一代數(shù)據(jù)分析系統(tǒng)開始照亮整個(gè)運(yùn)動(dòng)中更深層次的問題。
每場NFL比賽都會(huì)產(chǎn)生數(shù)百萬個(gè)原始追蹤數(shù)據(jù)點(diǎn),但原始數(shù)據(jù)流只是基礎(chǔ)。真正的數(shù)據(jù)增長來自將坐標(biāo)轉(zhuǎn)換為可用橄欖球洞察的模型。例如,壓力概率估計(jì)防守球員在傳球沖鋒的每個(gè)時(shí)刻影響四分衛(wèi)的可能性,并產(chǎn)生十幾個(gè)次級指標(biāo)。
Band估計(jì),新一代數(shù)據(jù)分析系統(tǒng)現(xiàn)在每次進(jìn)攻產(chǎn)生500到1000個(gè)統(tǒng)計(jì)數(shù)據(jù)。保持系統(tǒng)響應(yīng)性依賴于AWS基礎(chǔ)設(shè)施來接收數(shù)據(jù)流、運(yùn)行模型、在幾秒鐘內(nèi)為球隊(duì)和廣播公司返回結(jié)果,并存儲(chǔ)更廣泛的數(shù)據(jù)寶庫以進(jìn)行更深入的分析。
大數(shù)據(jù)碗競賽激發(fā)外部創(chuàng)新
那種更深入分析的根源可以追溯到2018年的首屆大數(shù)據(jù)碗競賽。在Lopez的領(lǐng)導(dǎo)下,它成為聯(lián)盟首次大規(guī)模向外部研究人員開放球員追蹤數(shù)據(jù)的努力,邀請他們解決諸如哪些防守球員最有效地縮小空間或如何預(yù)測傳球后球員移動(dòng)等問題。
作為一個(gè)持續(xù)數(shù)月的黑客馬拉松,這項(xiàng)年度競賽挑戰(zhàn)參與者在歷史追蹤數(shù)據(jù)上訓(xùn)練機(jī)器學(xué)習(xí)模型,并測試其對未見進(jìn)攻的泛化能力。重點(diǎn)越來越多地放在預(yù)測上——可以預(yù)測接下來會(huì)發(fā)生什么的模型。
一個(gè)早期的成功是2020年開發(fā)的超預(yù)期沖球碼數(shù)。該指標(biāo)衡量實(shí)際獲得的碼數(shù)與預(yù)期沖球碼數(shù)之間的差異,或者考慮到阻擋者和防守者的位置、速度和方向,聯(lián)盟平均水平的球員在同樣的沖球中預(yù)計(jì)會(huì)獲得的碼數(shù)。它有助于將某次沖球的強(qiáng)度以及跑衛(wèi)在一場比賽或一個(gè)賽季中的表現(xiàn)進(jìn)行背景化。
超預(yù)期沖球碼數(shù)很快從大數(shù)據(jù)碗競賽轉(zhuǎn)移到全國轉(zhuǎn)播。Lopez回憶起他第一次看到它出現(xiàn)的時(shí)刻,在2021年NFC錦標(biāo)賽海盜隊(duì)對陣包裝工隊(duì)的比賽中:"Leonard Fournette有一次很好的沖球,圖表立即彈出顯示他的超預(yù)期沖球碼數(shù)。那是在我們獲得獲勝方案后不到10個(gè)月。"他補(bǔ)充道:"我給電視屏幕拍了照,同事們也在給我發(fā)他們的照片。那是一個(gè)驕傲的時(shí)刻。"
這條管道已經(jīng)將大數(shù)據(jù)碗競賽變成了想法和數(shù)據(jù)科學(xué)人才的試驗(yàn)場。在其第一個(gè)十年中,大數(shù)據(jù)碗競賽已成為聯(lián)盟分析生態(tài)系統(tǒng)的核心部分。正如時(shí)任新奧爾良圣徒隊(duì)教練Sean Payton在2015年關(guān)于邊線實(shí)時(shí)數(shù)據(jù)崛起的俏皮話:"我認(rèn)為這意味著將有更多的MIT畢業(yè)生執(zhí)教。"
先進(jìn)模型將追蹤數(shù)據(jù)轉(zhuǎn)化為戰(zhàn)術(shù)洞察
在過去十年中,新一代數(shù)據(jù)分析系統(tǒng)已發(fā)展成為一個(gè)包含75多個(gè)機(jī)器學(xué)習(xí)模型的組合,涵蓋進(jìn)攻、防守、特殊球隊(duì)和比賽策略。其中,擒抱概率和防守警報(bào)可能最好地說明了如何將原始追蹤數(shù)據(jù)轉(zhuǎn)換為更清晰的球隊(duì)、廣播公司和球迷洞察。
擒抱概率估計(jì)防守球員在接觸時(shí)完成擒抱的可能性,考慮速度、角度、距離、杠桿和追擊。該數(shù)據(jù)允許新一代數(shù)據(jù)分析系統(tǒng)識(shí)別真正的擒抱機(jī)會(huì)、量化錯(cuò)失的擒抱,并計(jì)算防守球員節(jié)省或讓步的碼數(shù)。
防守警報(bào)評估開球前的防守陣型和移動(dòng),以預(yù)測哪些球員可能會(huì)沖鋒。該模型使用加速模式和開球前的移動(dòng),將它們與諸如第幾檔、距離和比賽狀態(tài)等情境背景相結(jié)合,然后應(yīng)用生成式AI預(yù)測可能的沖鋒者,他們會(huì)被紅色圓圈突出顯示給觀眾。
AWS首席體育顧問Dashiell Flynn說:"從轉(zhuǎn)播角度來看,防守警報(bào)產(chǎn)生了很大影響。"他強(qiáng)調(diào)了該模型如何暴露故意的誤導(dǎo):"有時(shí)預(yù)測是錯(cuò)誤的,因?yàn)榉朗乇旧碓谑褂谜`導(dǎo),試圖欺騙進(jìn)攻以為閃電戰(zhàn)即將到來。"這些時(shí)刻為比賽解說員提供了一種自然的方式來討論偽裝的防守壓力及其背后的意圖。
這些指標(biāo)共同展示了新一代數(shù)據(jù)分析系統(tǒng)模型如何將快速、模糊的時(shí)刻轉(zhuǎn)化為清晰的視覺和戰(zhàn)術(shù)解釋。
追蹤數(shù)據(jù)推動(dòng)球員安全改進(jìn)
推動(dòng)性能分析的同一個(gè)追蹤基礎(chǔ)也讓聯(lián)盟對球員安全有了更清晰的了解。通過捕捉每個(gè)球員的速度、間距和移動(dòng),它為聯(lián)盟提供了對長期被認(rèn)為有風(fēng)險(xiǎn)的比賽動(dòng)態(tài)的具體理解。
2024賽季引入的新動(dòng)態(tài)開球就是一個(gè)明確的例子。開球產(chǎn)生了太多危險(xiǎn)的高速碰撞。新一代數(shù)據(jù)分析系統(tǒng)幫助量化并最終改變了這一點(diǎn)。
Lopez說:"前一個(gè)賽季,我們展示了新一代數(shù)據(jù)分析系統(tǒng)的球員空間和相對速度的動(dòng)畫,該分析成為規(guī)則變更的關(guān)鍵部分。"
NFL競賽委員會(huì)測試了替代陣型,并確定了一種既減少高速接觸又不消除競爭元素的設(shè)計(jì)。兩個(gè)賽季的數(shù)據(jù)顯示動(dòng)態(tài)開球正在發(fā)揮作用:2025年的回球率躍升至75%(2024年為32%),即使增加了1157次進(jìn)攻,下肢受傷減少了35%,而腦震蕩率仍低于舊的開球形式。這一變化既帶來了更多動(dòng)作又減少了受傷。
光學(xué)追蹤帶來三維姿態(tài)估計(jì)
下一個(gè)重大進(jìn)展的基礎(chǔ)設(shè)施——光學(xué)追蹤——已經(jīng)嵌入每個(gè)NFL場館。該系統(tǒng)不僅記錄球員的二維位置,還使用4K攝像機(jī)捕捉關(guān)鍵關(guān)節(jié)(如肩膀、肘部、膝蓋、臀部和手)的完整三維位置。
結(jié)果是姿態(tài)估計(jì),為每次進(jìn)攻的每個(gè)球員提供數(shù)字骨骼模型。本賽季標(biāo)志著聯(lián)盟首次在每場比賽中實(shí)現(xiàn)Band所說的"完全安裝、完全捕捉",盡管數(shù)據(jù)仍保持內(nèi)部狀態(tài),等待驗(yàn)證、結(jié)構(gòu)化和存儲(chǔ)以供將來使用。
對于新一代數(shù)據(jù)分析系統(tǒng)團(tuán)隊(duì)來說,姿態(tài)估計(jì)在正確的時(shí)刻到來。Band說,十年的二維追蹤加深了對比賽的理解,"但這種新的骨骼數(shù)據(jù)將解鎖下一個(gè)層次。這是一個(gè)拐點(diǎn)。"
數(shù)據(jù)捕獲的規(guī)模值得停下來思考。標(biāo)準(zhǔn)位置追蹤每秒為每個(gè)球員收集10次單一的x,y坐標(biāo)。光學(xué)追蹤從16個(gè)角度捕捉高分辨率視頻,以每秒60次的頻率為每個(gè)球員的29個(gè)身體部位導(dǎo)出x,y,z坐標(biāo)。Flynn說:"數(shù)據(jù)量的爆炸可能令人生畏。但一旦人們理解了它,想法就會(huì)很快涌現(xiàn)。"
光學(xué)追蹤背后的管道分三個(gè)階段運(yùn)行:本地捕獲、現(xiàn)場處理和云分析。來自4K攝像機(jī)的高帶寬視頻無法足夠快地發(fā)送到云端,因此每個(gè)體育場都托管AWS服務(wù)器,在大約700毫秒內(nèi)處理數(shù)據(jù)。然后將處理過的簡化數(shù)據(jù)發(fā)送到云端,機(jī)器學(xué)習(xí)模型在不到100毫秒內(nèi)運(yùn)行并將分析返回給制作團(tuán)隊(duì)。這使整個(gè)捕獲到分析的管道保持在一秒以下。由于周四夜間橄欖球等轉(zhuǎn)播以大約兩秒的延遲運(yùn)行,因此從這些新數(shù)據(jù)得出的新一代數(shù)據(jù)分析可以在進(jìn)攻在屏幕上展開時(shí)有效地實(shí)時(shí)提供。
姿態(tài)數(shù)據(jù)的承諾在于它為橄欖球的幾何形狀增加的細(xì)節(jié)。Lopez說,它還解決了二維數(shù)據(jù)無法解決的歧義。"在傳球進(jìn)攻中,我們現(xiàn)在可以使用RFID數(shù)據(jù)看到球經(jīng)過球員,但我們不知道它是從他們的腿之間滾過還是飛過他們頭頂20碼。"
最終目標(biāo)是一個(gè)混合系統(tǒng),使用RFID識(shí)別每個(gè)球員的重心,并將其與完整的骨骼數(shù)據(jù)結(jié)合起來,當(dāng)球員從攝像機(jī)視野中相互遮擋時(shí),算法會(huì)填補(bǔ)空白。
姿態(tài)追蹤還將解鎖一種新的訓(xùn)練環(huán)境。四分衛(wèi)可以使用VR頭盔面對虛擬的傳球沖鋒,該沖鋒完全按照球場上的方式展開。Flynn說:"你看到那些前鋒沖向你,并學(xué)會(huì)在額外的半秒鐘內(nèi)將眼睛保持在球場下方。"
這種現(xiàn)實(shí)主義使安全訓(xùn)練和糾正讓年輕四分衛(wèi)陷入困境的習(xí)慣成為可能,同時(shí)也幫助他們在口袋中更快地做出決策。Flynn說:"Josh Allen花了幾個(gè)賽季才成為Josh Allen。也許這可以在半年而不是三年內(nèi)發(fā)生。"
新一代數(shù)據(jù)分析系統(tǒng)演變的每個(gè)階段都讓聯(lián)盟更接近于建模比賽的基礎(chǔ)機(jī)制,而不僅僅是其結(jié)果。隨著這些能力的融合,更廣泛的轉(zhuǎn)變變得更加清晰。在擴(kuò)展基礎(chǔ)數(shù)據(jù)統(tǒng)計(jì)十年后,NFL與AWS的合作已從追蹤實(shí)驗(yàn)演變?yōu)楦咏@項(xiàng)運(yùn)動(dòng)的神經(jīng)系統(tǒng)的東西。通過將橄欖球?qū)I(yè)知識(shí)與可擴(kuò)展的云基礎(chǔ)設(shè)施相結(jié)合,新一代數(shù)據(jù)分析系統(tǒng)繼續(xù)塑造比賽的進(jìn)行、執(zhí)教和理解方式。
但歸根結(jié)底,正是橄欖球的微妙深度吸引著人們。Band說:"這就像量子物理學(xué)。你可以盡可能地放大,每個(gè)尺度的變化都會(huì)揭示一些新東西。球場上到處都在發(fā)生比賽中的比賽。"事實(shí)證明,照亮這項(xiàng)運(yùn)動(dòng)的復(fù)雜機(jī)制并不會(huì)破壞魔力,只會(huì)加深敬畏。
Q&A
Q1:NFL新一代數(shù)據(jù)分析系統(tǒng)是什么時(shí)候推出的?它如何采集數(shù)據(jù)?
A:NFL新一代數(shù)據(jù)分析系統(tǒng)于2015年推出。系統(tǒng)在每套護(hù)肩墊和橄欖球內(nèi)植入RFID芯片,并在每個(gè)體育場周圍安裝20多個(gè)超寬帶接收器。系統(tǒng)每秒10次流式傳輸所有22名球員的坐標(biāo),每秒25次傳輸球的坐標(biāo),位置數(shù)據(jù)精確到幾英寸。
Q2:超預(yù)期沖球碼數(shù)這個(gè)指標(biāo)是如何工作的?
A:超預(yù)期沖球碼數(shù)指標(biāo)于2020年通過大數(shù)據(jù)碗競賽開發(fā)。它衡量實(shí)際獲得的碼數(shù)與預(yù)期沖球碼數(shù)之間的差異,預(yù)期碼數(shù)是根據(jù)阻擋者和防守者的位置、速度和方向,計(jì)算聯(lián)盟平均水平球員在同樣沖球中預(yù)計(jì)會(huì)獲得的碼數(shù)。該指標(biāo)幫助評估單次沖球強(qiáng)度以及跑衛(wèi)的整體表現(xiàn)。
Q3:光學(xué)追蹤技術(shù)與傳統(tǒng)位置追蹤有什么區(qū)別?
A:傳統(tǒng)位置追蹤每秒為每個(gè)球員收集10次二維x,y坐標(biāo),而光學(xué)追蹤使用4K攝像機(jī)從16個(gè)角度捕捉視頻,以每秒60次的頻率為每個(gè)球員的29個(gè)身體部位導(dǎo)出三維x,y,z坐標(biāo)。光學(xué)追蹤能夠創(chuàng)建數(shù)字骨骼模型,提供更詳細(xì)的姿態(tài)估計(jì)數(shù)據(jù),解決二維數(shù)據(jù)無法解決的許多歧義問題。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.