![]()
文丨馬舒葉
編輯丨盧枕
AI焦慮已經(jīng)從大廠滲透進(jìn)了大學(xué)這座象牙塔。在一片“被替代”的憂懼聲中,一群來自非北上廣深、非985高校的大學(xué)生,主動(dòng)跳進(jìn)了這股浪潮——他們不是來做實(shí)習(xí)的,是來兼職“擰螺絲”的,擰的是AI大模型的螺絲。
在“AI將替代99%的崗位”和“拿AI offer月入3萬”兩種聲音的共同影響下,這批不容易擠進(jìn)大廠實(shí)習(xí)隊(duì)伍的大學(xué)生,走進(jìn)了大廠數(shù)據(jù)標(biāo)注的流水線,成為新的AI工人。他們每天在大廠提供的兼職平臺(tái)上搶單、標(biāo)注、糾錯(cuò)、優(yōu)化,月收入大多在1000到2000元之間。在這條看不見的AI流水線上,他們既是訓(xùn)練者,也是被挑選的對(duì)象。
他們分散在成都、鄭州、武漢、廈門等非一線城市的角落,在課余或下班后的時(shí)間里,登錄那個(gè)決定他們今晚“有活干”還是“白蹲守”的后臺(tái),他們標(biāo)注圖片,校準(zhǔn)對(duì)話,貢獻(xiàn)鄉(xiāng)音,優(yōu)化代碼,試圖找到新的機(jī)會(huì)。
對(duì)于大廠來說,大學(xué)生群體兼具垂直領(lǐng)域的專業(yè)知識(shí)和充足的參與熱情,是完成最基礎(chǔ)的AI數(shù)據(jù)標(biāo)注、AI回復(fù)糾錯(cuò)、AI聲音識(shí)別等最合適的人群。通過向大學(xué)生伸出兼職橄欖枝,他們不僅能高效率地找到符合大模型訓(xùn)練要求的人,還能減輕雇傭正職員工的成本。
這成了一場“雙向奔赴”,甚至由于供不應(yīng)求,大廠AI數(shù)據(jù)標(biāo)注的兼職還需要搶單。只是,這份兼職真的能成為大學(xué)生們通往AI大廠的一條曲徑嗎?
大學(xué)生進(jìn)“廠”,擰大模型的螺絲
鄭州某高校大學(xué)教室里,剛剛結(jié)束一堂課,學(xué)生們魚貫而出,只有大三學(xué)生張瑩立刻打開手機(jī)。她要在下課的十幾分鐘內(nèi)“搶單”——在名為“Xpert”的平臺(tái)上,幾分鐘的不間斷重復(fù)點(diǎn)擊下,她終于搶到了一個(gè)任務(wù)。一旁的室友沒有她這么幸運(yùn),任務(wù)就像春節(jié)返家時(shí)的票,前一秒顯示還有6個(gè),點(diǎn)進(jìn)去的瞬間就歸了零。
她們都在做同一份兼職——張瑩稱這是給大廠的AI大模型“擰螺絲”。
起初,張瑩在學(xué)校兼職群里看到了學(xué)長的推薦。他只知道和AI訓(xùn)練有關(guān),項(xiàng)目名稱是“字節(jié)大模型領(lǐng)域?qū)<艺衅浮薄?strong>這份兼職不需要AI相關(guān)經(jīng)驗(yàn),只要在任何領(lǐng)域有專業(yè)知識(shí)即可,一次任務(wù)就有50-200元的收益,很適合她這樣的在校大學(xué)生。
搶到任務(wù)后,她需要根據(jù)出題專家給定的題目和答案完成評(píng)估,比如審核大模型在中文教學(xué)場景下的回復(fù)是否存在語音或語法錯(cuò)誤,然后進(jìn)行語言糾正。作為熟手,通常不到2分鐘她就能完成一個(gè)任務(wù)。接下來張瑩只要等待專家質(zhì)檢,通過就能領(lǐng)到對(duì)應(yīng)的兼職費(fèi)。
整個(gè)過程,張瑩都接觸不到真人。申請(qǐng)成為Xpert專家時(shí)是網(wǎng)頁提交驗(yàn)證資料,做任務(wù)時(shí)也是在線查看提前準(zhǔn)備好的說明文檔,沒有人教她怎么做,在進(jìn)入這個(gè)大模型兼職平臺(tái)后,她只能單向?qū)Υ竽P洼敵觥?strong>“我像是大模型的飼料。”張瑩表示。
來自武昌理工學(xué)院的王磊今年21歲,9月開始在“Xpert”平臺(tái)上接單,做的是最基礎(chǔ)的數(shù)據(jù)標(biāo)注:將圖像劃分為不同類別,區(qū)分風(fēng)景圖或人物圖;給文本打標(biāo)簽,判斷一篇新聞的主題屬于科技、娛樂還是體育。
“這工作聽起來簡單,但做起來挺磨人的。”王磊一般會(huì)選在沒有課的下午或晚上,一次做一兩個(gè)小時(shí)。在后臺(tái)界面上,系統(tǒng)清晰地記錄著他的“數(shù)字工時(shí)”:某天下午花費(fèi)1.5小時(shí),完成了8條文本標(biāo)注和2條模型反饋優(yōu)化任務(wù),總耗時(shí)1.5小時(shí),完成任務(wù)量10個(gè)。這些數(shù)據(jù)是他參與AI大模型訓(xùn)練的證明。
![]()
●大模型高薪兼職宣傳。圖源:受訪者截圖
不過這份兼職沒有宣傳的那樣高薪。
從去年下半年開始,王磊每周會(huì)拿出五天時(shí)間,做1-2小時(shí)任務(wù),一個(gè)月下來扣除審核不通過的任務(wù),收入在800-1200元之間。為了搶到更多兼職,王磊要找準(zhǔn)工作日的空閑時(shí)段不斷進(jìn)入后臺(tái)查看任務(wù)是否有更新。綜合算下來,時(shí)薪在80元左右。“和去校門口奶茶店搖奶茶差不多。”王磊告訴鏡相工作室。
時(shí)間長了,王磊也想嘗試那些單價(jià)更高的“出題”任務(wù),這些任務(wù)單次完成就能賺300-1000元,但往往限定在金融、法律或醫(yī)療等專業(yè)領(lǐng)域。“想拿到更高的兼職費(fèi)用,得有硬知識(shí)儲(chǔ)備,還得會(huì)抓大模型的知識(shí)盲區(qū)。比如出醫(yī)療題,你得知道專業(yè)術(shù)語和臨床常識(shí),不能瞎編。”非相關(guān)專業(yè)的王磊只能繼續(xù)做數(shù)據(jù)標(biāo)注。
據(jù)鏡相工作室了解,除了字節(jié)推出的Xpert會(huì)招攬大模型兼職訓(xùn)練專家外,阿里有曉天睿士、騰訊有AI Expert,這些大廠都會(huì)通過組建大模型專家社區(qū)構(gòu)建AI數(shù)據(jù)集。高薪則是這些兼職平臺(tái)共同的宣傳重點(diǎn),比如阿里曉天睿士宣稱參與者可以獲得高達(dá)每小時(shí)1000元的高薪,只是在詳情頁里,將兼職費(fèi)用的下限定為50元,并標(biāo)注了“以最終項(xiàng)目定價(jià)為準(zhǔn)”。
![]()
●兼職的出題要求,希望題目難倒大模型。圖源:受訪者
在為大模型做數(shù)據(jù)標(biāo)注、糾錯(cuò)之外,這些遠(yuǎn)離一線城市的大學(xué)生們也有別的兼職機(jī)會(huì)。
遠(yuǎn)在福建的林薇正在讀博一,今年在一位山東曲阜師大的朋友介紹下,她踏入了一個(gè)更為隱蔽和原始的AI數(shù)據(jù)采集層。她主要為大模型提供“聲音”——閩南語和臺(tái)灣腔普通話的錄音及轉(zhuǎn)寫。
由于福建方言“神似”臺(tái)灣腔,林薇得到的第一份任務(wù),是用閩南語或臺(tái)灣腔普通話進(jìn)行自言自語或雙人對(duì)話,錄制好的音頻將作為“語料”用于訓(xùn)練大模型的語音識(shí)別能力。隨著和AI打電話、AI錄音轉(zhuǎn)寫成為大廠AI App的標(biāo)配功能,大廠也需要更多方言作為語料喂養(yǎng)大模型。因此,林薇接觸的也不止Xpert,還有一些專門為大廠處理數(shù)據(jù)需求的中介平臺(tái)。
只是想憑賣聲音賺錢并不容易,這份兼職的要求極其繁瑣。有的項(xiàng)目要求在不同的環(huán)境噪音(低、中、高分貝)下進(jìn)行錄音,但“錄音平臺(tái)非常不穩(wěn)定,有時(shí)一直進(jìn)不去”,而且噪音分貝往往很難把控。
平臺(tái)審查更嚴(yán)格的是后續(xù)的文本轉(zhuǎn)寫工作,她稱之為“翻譯”。轉(zhuǎn)寫的文本將被喂給大模型,打磨大模型方言音頻轉(zhuǎn)化文字的識(shí)別能力。而由于閱讀這份文本的是大模型,林薇必須要寫成大模型能讀懂的樣子。她不僅要把音頻里的內(nèi)容一字不變地轉(zhuǎn)寫,且轉(zhuǎn)寫文本只能使用逗號(hào)、句號(hào)、問號(hào)和感嘆號(hào)四種標(biāo)點(diǎn)。這些細(xì)微到極致的格式要求,是在用最原始的人力,喂養(yǎng)AI的“標(biāo)準(zhǔn)化”輸出。
這樣的錄音往往會(huì)持續(xù)2-3個(gè)小時(shí),但“收入情況卻不是很理想”。林薇會(huì)被一些平臺(tái)騙稿,有些中介會(huì)以各種理由推脫、扣錢。她和她的“搭子”都曾深受其害。她描述了一種典型的陷阱:一個(gè)聲稱是“豆包”項(xiàng)目的老板,最初承諾每人100元,但在錄音數(shù)小時(shí)后,卻以“音色不符合”等模糊理由拒絕對(duì)“搭子”付款,林薇本人也只收到了60元。
雙非大學(xué)生,把AI兼職當(dāng)敲門磚
真正讓這些大學(xué)生感受到自己在“訓(xùn)練”AI而不僅僅是“服務(wù)”AI,來自于成功“難倒”大模型的時(shí)刻。
王磊在一次針對(duì)專業(yè)編程問題的反饋任務(wù)中,提出了一個(gè)用Python實(shí)現(xiàn)二叉樹層序遍歷并優(yōu)化時(shí)間復(fù)雜度的問題。豆包大模型給出的代碼雖然能運(yùn)行,但時(shí)間復(fù)雜度并非最優(yōu),并且漏掉了一個(gè)邊界條件處理。
“我把這個(gè)問題標(biāo)注出來,并詳細(xì)解釋了代碼中因冗余導(dǎo)致的復(fù)雜度偏高,還附上了優(yōu)化思路。”王磊說,“這時(shí)候我感覺到,我們其實(shí)就是針對(duì)它的知識(shí)盲區(qū)找出邏輯漏洞,相當(dāng)于幫大模型查漏補(bǔ)缺。”
林薇偶爾也會(huì)有一絲參與感,她專長是閩南語和臺(tái)灣腔,在和AI用方言打電話時(shí),她會(huì)感覺“自己確實(shí)也在參與訓(xùn)練大模型,給一個(gè)新的生命注入一些自己的特色,比如我們的腔調(diào),或者地方的一些文化”。
有一次標(biāo)注,張瑩的題目是:當(dāng)用戶說今天下雨沒帶傘,淋成了落湯雞,AI的回復(fù)是“建議下次帶傘”。張瑩立刻標(biāo)注“情感類吐槽別講大道理”,建議AI要先情感關(guān)懷,再加一句實(shí)用建議。還有次張瑩向AI吐槽課時(shí)太長時(shí),大模型回復(fù)“我懂這太累了,忙完記得喝點(diǎn)小甜水”,張瑩會(huì)嘀咕,“這搞不好是我當(dāng)初標(biāo)注過的”。
盡管做的是最基礎(chǔ)的工作,但偶爾,他們也能從“擰螺絲”中獲得一絲超越金錢回報(bào)的微妙體驗(yàn)。
而對(duì)于這些雙非大學(xué)生而言,這份兼職的更大意義,是給自己的簡歷添彩。
“我做這個(gè),一是因?yàn)楹蛯I(yè)相關(guān),二是想給簡歷加上AI相關(guān)經(jīng)驗(yàn)。”張瑩坦言,她學(xué)的是國際中文教育專業(yè),中文語用偏誤糾錯(cuò)本就是課程內(nèi)容。
在AI引發(fā)熱潮的這兩年,中文教育專業(yè)的就業(yè)越發(fā)緊張。不少教輔和留學(xué)機(jī)構(gòu)都引入了AI輔助學(xué)生學(xué)習(xí),傳統(tǒng)的中文教育崗位薪資一再走低。而張瑩在鄭州讀書,能接觸到的大公司并不多,這份AI兼職對(duì)她意義重大。
![]()
●現(xiàn)在連大學(xué)生找工作面試都是AI陪練、AI面試官。圖源:視覺中國
就在這個(gè)月,張瑩得到了一家頭部教培機(jī)構(gòu)的實(shí)習(xí)面試邀約,是做“AI+教培”的課程開發(fā)崗位,HR在邀約時(shí)就表示了對(duì)她大模型兼職經(jīng)歷的興趣。“如果沒有相關(guān)兼職經(jīng)驗(yàn),我連實(shí)習(xí)邀約都拿不到。”張瑩告訴鏡相工作室,并非985學(xué)歷的她在之前找實(shí)習(xí)時(shí)總會(huì)在第一輪簡歷初篩時(shí)就被篩下來。
面試時(shí),張瑩也被HR問到了大模型訓(xùn)練的具體流程和錯(cuò)誤校準(zhǔn)的邏輯,這些她都能結(jié)合之前的經(jīng)歷講解清楚。最終,她得到了這次實(shí)習(xí)機(jī)會(huì)。
計(jì)算機(jī)相關(guān)專業(yè)的王磊也有規(guī)劃。“我會(huì)在簡歷里寫‘參與過AI大模型訓(xùn)練相關(guān)兼職,負(fù)責(zé)過文本或圖像數(shù)據(jù)標(biāo)注,累計(jì)完成了多少任務(wù)量’。”他強(qiáng)調(diào),“這樣就不是空泛地說‘我做過AI兼職’,而是有具體成果。對(duì)非相關(guān)專業(yè)、想往AI領(lǐng)域靠的同學(xué)來說,是給履歷添彩的。”一段大模型相關(guān)實(shí)踐,或許是他們跨越學(xué)歷和地域門檻,拿到理想offer的一次機(jī)會(huì)。
AI時(shí)代的另一面:焦慮的大學(xué)生們
時(shí)代變了,象牙塔里的大學(xué)生們也感知到了用人市場的變化。
一方面,企業(yè)期待引進(jìn)AI以實(shí)現(xiàn)降本增效,在微軟、亞馬遜、X等科技大廠宣布更多代碼由AI生成的同時(shí),美國科技行業(yè)截至今年7月已累計(jì)裁撤近9萬崗位,同比增長36%。傳統(tǒng)崗位在縮減,AI相關(guān)崗位招聘在增多。根據(jù)獵聘數(shù)據(jù)研究院,今年上半年,AI技術(shù)新發(fā)職位整體增幅為36.82%。大廠校招成了風(fēng)向標(biāo),以阿里今年秋招為例,計(jì)劃發(fā)出的7000多個(gè)offer中,AI相關(guān)崗位占比超六成。
![]()
●11月,馬斯克宣布X用AI模型替代了大量員工,負(fù)責(zé)平臺(tái)安全的工程團(tuán)隊(duì)裁員90%。圖源:社交媒體
隨著AI技術(shù)的狂飆猛進(jìn),這群身處浪潮之中的年輕人,對(duì)于自己的未來既有憧憬,也有危機(jī)感。
王磊已經(jīng)開始感受到就業(yè)市場的壓力。作為計(jì)算機(jī)相關(guān)專業(yè)的學(xué)生,數(shù)據(jù)分析師是此前不少學(xué)長學(xué)姐的就業(yè)方向,而如今不少崗位已經(jīng)被AI替代。“有學(xué)長告訴我,他的公司引入大模型后,數(shù)據(jù)部門裁員了30%。”再加上處在湖北,能供王磊選擇的公司并不多,他也沒有雙一流的學(xué)歷優(yōu)勢(shì),畢業(yè)后,王磊要面臨更嚴(yán)峻的就業(yè)環(huán)境。
除了找工作越來越難,王磊還意識(shí)到,“AI時(shí)代一個(gè)人要身兼數(shù)職,比如會(huì)軟件開發(fā)的人還得懂運(yùn)維。以后數(shù)據(jù)分析也可能被AI替代。企業(yè)需要的工作人員要同時(shí)兼具多個(gè)角色,或者被機(jī)器人取代。”但他還是保留了一絲樂觀,“不過機(jī)器人還是要有人來操控的。”
做大模型相關(guān)兼職成為了他們?cè)诖髮W(xué)階段對(duì)抗焦慮的方法之一。
大廠的模型訓(xùn)練需求催生了這些兼職平臺(tái),在國內(nèi)有Xpert、曉天睿士、AI Expert和各種中介平臺(tái);在海外,也有以O(shè)penAI為大客戶的Mercor,剛在8月完成3.5億美元的C輪融資,估值達(dá)到100億美元。不過,對(duì)這些雙非大學(xué)生來說,即便是這些低門檻的兼職平臺(tái),也越來越卷了。
已經(jīng)工作3年的張毅見證了這條流水線從“藍(lán)海”到“紅海”的變遷。“2022年那會(huì)兒,搶單接單都容易。平臺(tái)剛推出這類任務(wù),做的人少,甚至不算嚴(yán)格意義上的搶單。”他回憶,那時(shí)平臺(tái)每天有固定任務(wù)或時(shí)段性上新,無需掐點(diǎn)蹲守,即便下班晚上七八點(diǎn)登錄,也照樣有活干。
與王磊這樣的“新手”相比,在成都工作的張毅可謂是這條流水線上的“老師傅”。93年出生的他,從2022年就開始游走于美團(tuán)的“龍貓數(shù)據(jù)”和字節(jié)的“Xpert”兩個(gè)平臺(tái)之間。
他記得自己是如何“入行”的:“當(dāng)時(shí)刷到一個(gè)職場圈的公眾號(hào),推送了龍貓的兼職,標(biāo)題寫的是‘本地生活內(nèi)容校準(zhǔn),下班就能做’,就去了解了一下。”他所做的“本地生活內(nèi)容校準(zhǔn)”,是為AI對(duì)話進(jìn)行校準(zhǔn),涉及社區(qū)周邊商鋪的推薦、便民服務(wù)點(diǎn)的位置信息,以及口語化表達(dá)的準(zhǔn)確性。
那是屬于早期參與者的“紅利期”。張毅細(xì)數(shù)著當(dāng)時(shí)的“好光景”:一條合理的方言便民指引能拿到1到2元,一組十條的地址校準(zhǔn)報(bào)酬是8到10元。“那會(huì)兒下班做個(gè)一兩小時(shí),周末抽半天時(shí)間,一個(gè)月下來賺2000到4000元都非常輕松。”不過,當(dāng)下?lián)寙巫冸y了,隨著越來越多人涌入,數(shù)千個(gè)任務(wù)往往不到一分鐘就會(huì)搶光,他說:“未來肯定會(huì)更卷。”
“在訓(xùn)練AI的時(shí)候,我不再是牛馬,而是牛馬的飼料。”張瑩的一句話,為這份看似站在技術(shù)前沿的AI兼職,添上了一抹現(xiàn)實(shí)底色——在宏大的技術(shù)敘事下,個(gè)體感受到的是自身的渺小與工作的瑣碎。在張瑩看來,AI吸收她的經(jīng)驗(yàn)、知識(shí),變成一個(gè)更強(qiáng)大、更不知疲倦的牛馬,最終也難免會(huì)取代她。不過眼下,她還是可以通過訓(xùn)練AI先得到工作機(jī)會(huì)。
隨著大廠在AI大模型訓(xùn)練上的持續(xù)加碼,這條由代碼、數(shù)據(jù)和聲音構(gòu)成的龐大流水線將持續(xù)運(yùn)轉(zhuǎn),這些大學(xué)生們則是這條流水線上沉默的大多數(shù),終將成為智能涌現(xiàn)后不被看見的“微塵”與“聲紋”。
【 版權(quán)聲明】所有內(nèi)容著作權(quán)歸屬鏡相工作室,未經(jīng)書面許可,不得轉(zhuǎn)載、摘編或以其他形式使用,另有聲明除外。
鏡相工作室正在尋找 商業(yè)領(lǐng)域的優(yōu)秀作者加入,請(qǐng)查看:
繼續(xù)閱讀:
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.