![]()
![]()
(圖/《機械姬》電影劇照)
越是在這樣的環(huán)境下,女性越需要勇敢發(fā)聲,即便沒有被提問,也要主動尋找機會表達觀點、融入討論,讓自己的光芒被看見。
?記者 | 潘文捷
?編輯 | Felicia
北京的一個傍晚,林詠華在辦公室里接待了我。她微笑著說,自己身為女性,一路走來,得到了許多的鼓勵和支持。她帶領(lǐng)團隊做系統(tǒng)性的創(chuàng)新,也參與和組織了不少行業(yè)女性的活動。
林詠華對計算機技術(shù)的熱愛,始于她在廣州本地少年宮上的編程啟蒙課。從AppleⅡ上的LOGO語言,到中華學(xué)習(xí)機上的C語言,她早早便沉浸于代碼天地中。為了支持她的興趣,母親不惜花掉半年薪水為她購置了一臺“286電腦”。于是,她不再滿足于常規(guī)操作,而是癡迷于鉆研底層技巧,例如如何優(yōu)化有限的內(nèi)存,讓黑白屏幕呈現(xiàn)出模擬彩色的效果。高中時代,管財務(wù)的母親被手抄工資條折磨得眼花,便“委托”女兒幫忙。林詠華一邊備戰(zhàn)高考,一邊通過自學(xué),編寫出了一套用于記賬發(fā)薪的程序。
后來,林詠華在西安交通大學(xué)就讀,當(dāng)時她雖然擁有保研名額,但需要找到愿意接收她的導(dǎo)師。她找到系里最有名且以嚴(yán)厲著稱的導(dǎo)師——殷勤業(yè)。當(dāng)時,實驗室里主要是男生。殷勤業(yè)給了林詠華一個月時間去解決一個難題,以此考察她的動手能力。林詠華成功解決了難題之后,殷勤業(yè)同意接收她。“在我后續(xù)整個研究生學(xué)習(xí)過程中,殷老師對我的要求很嚴(yán)格,但也給了我很多支持。”林詠華說。
![]()
(圖/作者提供)
進入職場后,林詠華有十六七年都在IBM中國研究院工作。“我很幸運,因為IBM本身很鼓勵女性走上技術(shù)崗位、技術(shù)領(lǐng)導(dǎo)崗位。我的上級領(lǐng)導(dǎo),包括我的mentor(導(dǎo)師),都很幫助我成長。”當(dāng)時IBM的董事長、首席執(zhí)行官羅睿蘭是一位女性,她在整個公司發(fā)起了托舉技術(shù)領(lǐng)域女性的計劃。
林詠華在IBM晉升到技術(shù)領(lǐng)域的最高崗位——杰出工程師(Distinguished Engineer)。“羅睿蘭女士通過多年的努力,成為IBM首位女性董事長,她也希望有更多的女性能像她這樣,走上領(lǐng)導(dǎo)崗位。我相信這是她希望能夠幫助更多女性成長的原因。”林詠華說道。
2018年,林詠華被IBM總部任命為IBM中國研究院院長。她不僅是該院成立以來首位在中國本土成長起來的院長,也是首位女性院長。這是標(biāo)志著其個人職業(yè)成就與公司人才發(fā)展的重要里程碑。
為了推動AI領(lǐng)先的科研成果實現(xiàn)產(chǎn)業(yè)落地,林詠華加入了非營利性研究機構(gòu)——北京智源人工智能研究院(下文簡稱“智源”),現(xiàn)擔(dān)任該研究院的副院長兼總工程師。
在接受《新周刊》的采訪時,林詠華談到了身為一名技術(shù)型女性,她如何幫助其他女性共同成長,也談到了目前她在人工智能領(lǐng)域的一些重要關(guān)切和取得的突破。
![]()
女性該怎么“推銷”自己?
新周刊:你在IBM中國研究院得到了大量的支持和幫助,你自己后來有做類似的工作嗎?
林詠華:我在2017年牽頭成立了IEEE女工程師協(xié)會北京分會。當(dāng)時依托IBM中國研究院與眾多高校的緊密合作,我們在產(chǎn)學(xué)研領(lǐng)域具備了一定影響力,也借此為女性技術(shù)人才——無論是科研人員還是工程師——搭建起一個專屬平臺。2019年我們舉辦了首屆論壇,之后每年延續(xù)。如今我已不再擔(dān)任會長職務(wù)了。
這類組織在海外起步較早,例如英偉達GTC大會就設(shè)有“女性免費、男性付費”的交流派對,以此吸引更多女性參與。我們創(chuàng)立IEEE女工程師協(xié)會北京分會之初,國內(nèi)還鮮有專門面向女性科技工作者的平臺;但如今,包括中國計算機學(xué)會在內(nèi)的多家學(xué)會,以及國內(nèi)許多行業(yè)的重要會議,都已設(shè)立專門針對女性開發(fā)者與研究人員的分論壇,為她們創(chuàng)造交流與見面的機會。
在這些會議上,議題往往更偏向“軟性”。參與者中既有經(jīng)驗豐富的分享者,也有不少剛剛步入職場或?qū)W術(shù)領(lǐng)域的年輕女性,她們常帶著困惑而來,或希望拓展人脈。我們的分享雖然會涉及技術(shù),但更多時候是探討技術(shù)女性如何充實自我、突破局限,更清晰地認(rèn)識自身優(yōu)勢,看見自己未來可能成為的樣子。
![]()
(圖/來源網(wǎng)站unsplash)
新周刊:很多女性初入職場,可能不是很自信,不知道怎么展現(xiàn)自己。
林詠華:我很早就注意到這個問題。剛?cè)肼殘鰰r,每個人都會經(jīng)歷從表現(xiàn)平平到逐漸出色、從無人知曉到被人認(rèn)可的過程。確實有人天生自信,不管做得怎樣都信心滿滿,但大多數(shù)人——尤其是中國人——性格較為謙虛內(nèi)斂,在職業(yè)起步階段,自信心往往還沒建立起來。
信心不是一天養(yǎng)成的。那時我意識到,人如果一直不敢表達自己,只會被困在囚籠里。剛參加工作那幾年,我經(jīng)常逼自己在會上必須至少發(fā)言一次,就這樣一點點把自信建立起來。
當(dāng)時常有一些從美國來的資深研究員主持圓桌討論,他們都是我們敬仰的領(lǐng)域?qū)<摇BM也會優(yōu)先推薦女性研究人員參加討論。但即便被安排坐到圓桌邊,如果自己不主動發(fā)言,也是白白浪費機會。為了給專家留下印象,便于日后能有合作的機會,我只能一次次逼迫自己開口。
新周刊:我看到你在過往的采訪中說,同樣是坐在桌子前,但如果不主動“推銷”自己,第一個被提問的人往往不會是女性,尤其是在技術(shù)領(lǐng)域。你是怎么打破這個局面的?女性應(yīng)該如何主動“推銷”自己?
林詠華:我相信很多女性技術(shù)工作者都經(jīng)歷過類似的局面:坐在會議桌前,如果桌上沒有名牌或職務(wù)說明,別人往往會默認(rèn)這些女性從事的是非技術(shù)類崗位,或是擔(dān)任非技術(shù)類崗位的領(lǐng)導(dǎo)。我們必須承認(rèn),現(xiàn)實中的數(shù)據(jù)確實如此。尤其在技術(shù)類崗位領(lǐng)導(dǎo)層,女性占比低于20%。所以為了不“猜錯”被提問者的職務(wù),人們往往會先向男性提問。
越是在這樣的環(huán)境下,女性越需要勇敢發(fā)聲,即便沒有被提問,也要主動尋找機會表達觀點、融入討論,讓自己的光芒被看見。謝麗爾·桑德伯格所著的《向前一步——女性,工作及領(lǐng)導(dǎo)意志》中對我最重要的提醒就是:開會時不要坐在后排,不要因為沒被點名而慶幸“逃過一劫”,而是應(yīng)該主動“向前一步”。這不僅是對女性的鼓勵,對男性同樣適用。
![]()
《向前一步——女性,工作及領(lǐng)導(dǎo)意志》
[美]謝麗爾?桑德伯格 著
顏箏 譯
中信出版社,2013-6
新周刊:參加女性會議和參加普通會議有什么不一樣?
林詠華:在當(dāng)前高校計算機專業(yè)中,本科生的男女比例常維持在7∶3,有的學(xué)校女性的占比甚至更低;進入技術(shù)職場后,女性的占比會進一步下降。這也導(dǎo)致技術(shù)會議中男性常占80%甚至90%以上。若一位女性本身性格并不外向,在這樣的環(huán)境中往往更難主動參與交流。
男性之間可能通過一個拍肩就可以展開對話,而女性技術(shù)人員往往缺乏破冰的勇氣。但在純女性場合中,她們更容易放松,也能更快建立起有效聯(lián)結(jié)。女性會議雖不能替代無性別導(dǎo)向的會議,卻能讓參會者——尤其是學(xué)生、青年教師或企業(yè)職員——更直接地與院士、教授或技術(shù)領(lǐng)袖交流,拓展研究、實習(xí)或項目合作的機會。無論男女,融入技術(shù)社區(qū)、拓展專業(yè)人脈都同樣重要。
新周刊:我看到你在一個采訪中說:“說起來有一陣子我對智源還挺自豪的,當(dāng)時智源內(nèi)部的AI系統(tǒng)、AI大模型評測、語言大模型團隊的負(fù)責(zé)人都是女性。”為什么智源有很多女性擔(dān)任團隊負(fù)責(zé)人?有什么重要的特點或長處能助力她們晉升到這些位置?智源有支持女性的舉措嗎?
林詠華:我是在2022年發(fā)現(xiàn)這個現(xiàn)象的。那時,我們的數(shù)據(jù)研究組經(jīng)理是女性,AI系統(tǒng)組經(jīng)理是女性,語言模型組經(jīng)理是女性,AI評測組經(jīng)理也是女性。我在一次IEEE女工程師協(xié)會年會上,特意把她們的照片放在一起,很自豪地告訴大家,智源大模型團隊從上到下不同層級的領(lǐng)導(dǎo)大都是女性。但這并不是刻意安排的。
我們的人數(shù)不多,因此并未刻意推動這類項目,畢竟它們需要大量參與者。坦白說,今天的女性仍須同時承擔(dān)工作與家庭的雙重責(zé)任。相較于國內(nèi)一些大廠,智源為有需要的同事提供了更加靈活的工作條件。在這一靈活體制下,受益更多的無疑是女性同事。
![]()
(圖/來源網(wǎng)站unsplash)
新周刊:你認(rèn)為,身處行業(yè)之中,個體是否應(yīng)該關(guān)注自己的性別身份?
林詠華:不需要太關(guān)注這件事,否則很容易先把自己矮了半截。但是無論女性還是男性,“向前一步”的做法其實都適用——去表達,更主動地去承擔(dān)一些責(zé)任。
![]()
AI硬件的創(chuàng)新還遠(yuǎn)遠(yuǎn)沒到滯緩期
新周刊:智源發(fā)布的CCI4.0已經(jīng)成為全球范圍內(nèi)具有影響力的高質(zhì)量中英文數(shù)據(jù)集。對于數(shù)據(jù)集中可能存在的各種偏見(例如文化、性別、地域等),你們是怎么識別、評估和處理的?在構(gòu)建如此大規(guī)模、高質(zhì)量的數(shù)據(jù)集時,你們面臨的最大技術(shù)挑戰(zhàn)是什么?
林詠華:原始的數(shù)據(jù)的確會有很多不同的價值觀、偏見等。我們會訓(xùn)練特定的模型,設(shè)計各種規(guī)則,對數(shù)據(jù)集進行清洗和過濾。經(jīng)過清洗和過濾之后,可以大幅減少這些問題對數(shù)據(jù)集的影響。但是畢竟數(shù)據(jù)集為中英雙語,規(guī)模超過30TB,無法保證每一行數(shù)據(jù)都無誤或來源準(zhǔn)確。作為數(shù)據(jù)集的提供方,我們正憑借自有技術(shù)能力努力做得更好。
打造開源數(shù)據(jù)集,最難的是預(yù)判用戶需求。用戶遍布千行百業(yè),眾口難調(diào)。今年我們采取了兩項重要措施:其一,為CCI數(shù)據(jù)集打上詳盡的標(biāo)簽,僅質(zhì)量維度便分為高、中、低三級,用戶可按標(biāo)簽自行過濾;其二,推出工具平臺“數(shù)據(jù)魔方”,從“我們猜用戶要什么”轉(zhuǎn)為“用戶自己定義要什么”。用戶只需用一兩句自然語言描述自己的需求,平臺即可從海量數(shù)據(jù)中即時聚合符合條件的數(shù)據(jù)集并提供下載服務(wù),讓每位應(yīng)用開發(fā)者或行業(yè)模型開發(fā)者都能取用所需數(shù)據(jù)。我們近期還會開源一項重要的具身智能數(shù)據(jù)集RoboCOIN,這是全球本體數(shù)最多、標(biāo)注最細(xì)、使用最便捷的雙臂機器人操作數(shù)據(jù)集。
![]()
(圖/《機械姬》電影劇照)
新周刊:為什么需要提供低質(zhì)量的數(shù)據(jù)集?
林詠華:對于特別低質(zhì)量的數(shù)據(jù),我們會直接過濾,但是總會有通過打分來區(qū)分的稍低質(zhì)量的數(shù)據(jù)。大模型在學(xué)習(xí)的時候,不能完全依靠高質(zhì)量數(shù)據(jù)——如果只見過高質(zhì)量數(shù)據(jù),日后的容錯性就比較低。比如,很多時候可能會有一些同音字錯誤,如果大模型只學(xué)習(xí)了正確的寫法,當(dāng)咱們問的問題里頭摻雜了幾個同音錯字,它可能就回答不出來了。
同樣,我們不僅需要提供成功的數(shù)據(jù),也得提供一些失敗的數(shù)據(jù)。見過失敗的數(shù)據(jù),模型才能夠自我糾錯。例如讓它去拿一瓶水,可能它會將水推倒,那它就知道這瓶水倒了之后,接下來要干什么;如果永遠(yuǎn)只是正向地告訴它這瓶水該這么拿,那么萬一這瓶水倒了,它就不知道該怎么做了。
新周刊:普通人使用AI工具時,常常很難判斷各家AI工具的優(yōu)劣。能否談?wù)勀銈冊贏I大模型評測方面的理念和方法論?一個客觀、科學(xué)的評測體系對于引導(dǎo)大模型技術(shù)健康發(fā)展有多重要?
林詠華:我們一直認(rèn)為,大模型評測的核心是“以評促優(yōu)”,即通過評測推動模型變得更加優(yōu)秀。因此在我們看來,打榜(即讓模型在公開的測試平臺或榜單上進行“考試”或“擂臺PK”,用分?jǐn)?shù)或排名來展示自己當(dāng)前的能力水平)本身是一件特別次要的事情。如今,眾多榜單反復(fù)測試的,很多都是常識問答題、數(shù)學(xué)題、編程題等。邏輯答題能力雖然重要,但如果評測始終圍繞這類能力打轉(zhuǎn),行業(yè)便容易忽視對新能力的探索。我們的理念始終是:有能力去設(shè)計更新穎的評測維度,可以挖掘模型尚未暴露的問題,并引導(dǎo)大模型企業(yè)向這些新能力進發(fā)。
智源大模型評測團隊自2022年起就持續(xù)挖掘和評估大模型能力。語言模型剛興起時,我們已著手相關(guān)工作。2024年,我們多次發(fā)版公布結(jié)果,并與北京市海淀區(qū)教委合作,邀請海淀區(qū)教師出了一系列覆蓋小學(xué)三年級至高中三年級、涵蓋多科目的K12新題,確保這些資料是模型從未見過的,再評測模型的測試結(jié)果,并與人類智力水平——例如海淀區(qū)學(xué)生的平均水平,進行對比。
今年年初,我們決定啟動全新的推理邏輯評測,原因在于當(dāng)前大模型的能力已邁上新臺階,沿用舊有評估方法已難以挖掘更多問題。因此,自今年3月開始,我們花費了大半年時間投入全新的、針對邏輯推理能力的題庫建設(shè),其中大量題目需人工主觀評定,耗時極長。我們針對DeepSeek等模型的邏輯推理的新特性——先輸出長段思考過程,再給出結(jié)論——搭建了評測集、評測方法和評測基準(zhǔn)。我們也剛發(fā)布了一套全新的邏輯推理評測體系。
![]()
(圖/來源網(wǎng)站unsplash)
當(dāng)前用戶普遍關(guān)心的是,面對復(fù)雜的、未收錄的提問,模型能否答對。但是,模型輸出推理需消耗大量token,成本最終仍會折算到消費者或企業(yè)的賬單上。因此,新評測不僅比較哪種大模型能在邏輯推理上攻克更陌生、更復(fù)雜的問題,還要比較哪種大模型能用更少的token、更低的成本給出正確答案。
再舉一個例子。大模型有時候輸出的答案是對的,但“思考”或者推理的過程可能全是錯的;也有一些情況中,過程是對的,但輸出的結(jié)果卻是錯的。其實很多時候,這不光是用戶關(guān)心的問題,大模型企業(yè)也很關(guān)心——企業(yè)方也想從評測里知道,現(xiàn)在大模型普遍存在什么樣的問題。
新周刊:你強調(diào)打破中心化、封閉的“煙囪式”生態(tài),是什么意思?
林詠華:AI硬件的形態(tài)還遠(yuǎn)遠(yuǎn)沒有收斂。把人腦跟AI芯片對比,人腦可以用百萬分之一的功耗、萬分之一的訓(xùn)練數(shù)據(jù)量,就達到與現(xiàn)在大模型持平的智力水平。這說明,人腦無論是在結(jié)構(gòu)的高效性還是在學(xué)習(xí)方法的高效性上,仍然遠(yuǎn)優(yōu)于現(xiàn)有的AI芯片架構(gòu)或算法模式。正因如此,硬件的顛覆性創(chuàng)新還將持續(xù)。
![]()
(圖/作者提供)
問題在于,每一款芯片從設(shè)計到批量落地,投資都高達幾億元甚至更多。如果上層的軟件完全用不起來或者不能適配,新的芯片就無法被大范圍、便捷地使用,投資也就打了水漂。這樣的話,試問誰還敢再投資下一款創(chuàng)新芯片?這必然阻礙芯片的創(chuàng)新,也阻礙AI能力的提升。
因此,我們希望打造一個開放的計算生態(tài):底層是各種AI芯片,上層是各種AI算法和模型,中間原本是煙囪式垂直割裂的軟件生態(tài),現(xiàn)在我們希望與業(yè)界一起打造統(tǒng)一開源的基礎(chǔ)軟件棧,讓創(chuàng)新的大模型算法可以用同一套技術(shù)棧運行各種AI硬件。
這樣做的好處有二:第一,開發(fā)者、用戶、企業(yè)可以按需選用芯片,選擇多了,芯片的價格自然下降,使用門檻更低;第二,制作AI硬件的企業(yè)和芯片創(chuàng)新企業(yè)可以專注于下一代架構(gòu)創(chuàng)新,而上面的軟件棧由社區(qū)共同推進,實現(xiàn)產(chǎn)業(yè)分工。
這項技術(shù)相當(dāng)具有挑戰(zhàn)性。我們目前正在聯(lián)合多個科研機構(gòu)的力量,共同打造一套統(tǒng)一開源、面向多種AI芯片的系統(tǒng)軟件棧——眾智FlagOS,向下要兼顧不同芯片的架構(gòu),并讓每種芯片都能極致發(fā)揮其性能。然而,“統(tǒng)一”與“極致”之間天然存在矛盾——如果只追求統(tǒng)一,所有芯片可能只能停留在中位性能;如果放棄統(tǒng)一,單一芯片雖可做到極致,卻失去了通用性。如何平衡兩者,是設(shè)計上的核心難點。
這是從芯片角度出發(fā)的思考。向上層看,還存在用戶開發(fā)語言發(fā)散的問題。用戶可能直接在語言層開發(fā)AI算法,而語言層本身正逐漸發(fā)散成多種編程語言。我們無法強迫開發(fā)者只能使用某一種語言。因此,中間技術(shù)棧既要平衡下方芯片的差異,又要兼顧上方用戶對各類開發(fā)語言的選擇需求。
新周刊:一種常見的憂慮是把人類與AI對立起來,擔(dān)憂AI有朝一日會替代或毀滅人類。也有像唐娜·哈拉維這樣的女性思想家會用“后人類主義”確立起新的開放式框架,換一個角度去思考人機之間的情感聯(lián)結(jié)。從一個技術(shù)實踐者的角度看,你如何看待人類與AI的未來?
![]()
《類人猿、賽博格和女人:自然的重塑》
[美]唐娜·哈拉維 著
陳靜 譯
河南大學(xué)出版社,2016-12
林詠華:我始終認(rèn)為未來必然是人機協(xié)同。例如智源在打造眾智FlagOS技術(shù)棧的過程中,為加快迭代,讓生態(tài)更蓬勃,我們正在大量使用大模型和AI自動化方式,使技術(shù)棧對算法場景的覆蓋迭代速度更快。
這個過程本質(zhì)上就是人機協(xié)同:我們構(gòu)建的技術(shù)棧本身服務(wù)于AI發(fā)展,未來將孕育出更好的芯片與算法;同時,我們也用AI來加速技術(shù)棧自身的迭代。今年,我們發(fā)布了名為Triton-Copilot的自動化AI工具,用于幫助大模型的開發(fā)人員自動生成Triton語言的算子。我們非常相信人機協(xié)同的價值。
當(dāng)然,其中確有必須守住的紅線。若在某些場景下刻意用AI作惡,必然引發(fā)災(zāi)難性后果。這也正是當(dāng)前人工智能學(xué)術(shù)界與產(chǎn)業(yè)界已形成的共識:AI安全與“AI向善”必須深深刻進所有從業(yè)者的腦海,大家共同守住這一底線。所謂“道高一尺,魔高一丈”,因此AI安全研究不可或缺。智源也已確立AI安全的研究方向,專門探討“矛與盾”的問題。
696期雜志
《她世紀(jì)2.0》已上市
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.