<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      “數據百曉生”的主要任務,就是給AI出題、編寫“理想態”

      0
      分享至

      “這是個需要高質量人文社科人才的崗位,因為只有最善于思考人與世界關系的人類,才能教會AI怎么更好的做一個人。”



      文 /巴九靈

      這篇文章開始之前,先邀請大家猜猜下面這份招聘要求對應的是什么崗位。



      揭曉答案:這份看起來要求不低的工作,招聘的是AI數據標注員。在BOSS直聘上,這個崗位月薪最高接近兩萬元;部分崗位直接注明“重點大學本碩博優先”。

      通俗地說,數據標注員就是AI的老師,負責對文本、圖像、音頻等原始數據進行分類、標記或注釋,從而教會機器識別、理解并學習人類世界的邏輯和知識。

      2020年起,“人工智能訓練師”正式被納入國家職業分類目錄,“數據標注員”是其中的重要工種之一。據國家數據局,截至今年9月底,我國7個數據標注基地共有標注企業362家,標注從業人員達8.5萬人。

      但這個行業仍缺乏人才。量子位智庫2023年底發布的《中國AIGC數據標注產業全景報告》顯示,未來5年,中國數據標注專業人才缺口或達百萬量級。

      那么,數據標注到底是一份什么樣的工作?



      “985”“QS100”碩博,

      給AI當老師

      小鵝本科就讀于一所“211”高校,目前在一家“985”高校讀研,學的是歷史學專業。她曾在大四那年做過一份數據標注實習的工作。

      她每天的工作,就是面對一張科技公司發來的、填滿后臺收集的用戶提問和AI生成答案的Excel表格,給AI的答案打分。小鵝處理一條數據平均花費的時間是15分鐘左右,少數棘手的任務,單條就要花上近一個小時。

      這份實習不需要面試,招聘方會提供一份打分標準手冊和一套測試題,要求自學手冊內容后,在測試題中選5道,完成后上交,正確率超過80%即視為通過。

      小鵝當初花了一個下午學習這份標注手冊,又花了2個小時完成5道測試題,才通過了考核。

      起初覺得易如反掌的小巴,嘗試了小鵝發來的兩道題,結果正確率不足50%。這才發現,這份工作遠比我們想象的困難。

      ◎ 首先,標注手冊中包含大量術語,理解門檻極高。比如,“缺少富媒體形式”,是指答案中沒有包含短視頻鏈接;“prompt外泄”,是指答案暴露了提問未涉及的內部指令;“弱相關內容或冗余殘留”,就是答案和提問沒關系。

      ◎ 其次,打分要求極其繁瑣、嚴格。標注者需要在“0、1、2、3”四個檔位中給3個答案分別打分,并根據答案在準確性、結構性、相關性、全面性等方面的缺陷,分別打好標簽,備注原因;然后把三個答案依次排序,逐一解釋理由。



      進行數據標注的工作人員

      對于如何判定分數和標簽,接近6萬字的標注手冊列舉出了幾十種具體分析場景,這些分析費時費力。比如,判斷是否出現幻覺,需要一一核對參考資料;涉及專業知識,需要自己查找資料去驗證。

      除了打分,另一種常見的標注形式是“出題”,難度更大。剛獲得海外語言類專業博士學位的小凡,求學時做了長達5年的數據標注兼職。她的工作是在一家海外眾包標注平臺上給AI出題并寫出解答,難度達到博士級別。這些文本會被作為訓練語料,喂給AI。

      從招聘市場情況看,這份職業的天花板極高。

      今年以來,各家頭部大模型公司開始在招攬專家級標注員上競速。比如,阿里搭建了“曉天睿士”專家社區,學歷要求頭部高校碩士起步,行業專家級人才最高時薪可達1000元。字節跳動成立了Xpert兼職眾包標注平臺,需要標注者上傳簡歷、選擇標注的細分專業領域,并完成難度較高的專業知識測試。

      另一方面,行業的“入場券”也在快速漲價。

      一位負責多家頭部企業標注人員招聘的HR告訴小巴,近兩年,標注崗位招聘要求不斷提高。

      早期招聘要求的學歷水平大多在???、高中,無需經驗、上手就能做。但今年,候選人本科以上學歷的占比超過五成。通用類AI標注開始有經驗要求;垂直類一般要求相關專業或行業經驗,部分崗位需要做專業筆試。

      競爭也逐漸激烈,目前招聘通過率大約是2:1。

      持續吸納高端人才,成為標注行業肉眼可見的趨勢。



      部分公司數據標注招聘要求



      不算體面的工種

      頂尖人才正涌入數據標注行業,但身處其中的人們,大多態度悲觀。

      在高強度的標注實習中,小鵝感受到了這個行業巨大的矛盾。

      ??其一,缺乏尊嚴。

      小鵝最反感的是工作中沒完沒了的扯皮。文字判斷有巨大的主觀模糊空間,作為乙方的標注員與作為甲方的質檢員經常會發生爭執。比如,甲方認為A答案的邏輯性更強,而乙方認為B答案更完善。

      在這些爭論中,她感到標注員角色的巨大矛盾性:雖然承擔著AI工程里超過60%的工作量,但他們在這個系統里是不被尊重的。隨著模型的進化和調整,甲方給出的打分標準會經常變動,但標注員們往往無法撼動現有的標準,只能接受甲方的評判。

      她也感到這份工作缺乏獲得感。即便標注已經成為一個知識密集行業,但仍采取著流水線式的管理方式,絕大多數標注工作采取計件制計薪。標注的工作本質是消耗腦力處理一條條數據,但并不知道這些數據從哪來、到哪去,甚至不少標注員不知道自己標注的是哪個大模型。

      ??其二,性價比低。

      小鵝此前實習的公司是一家外包標注機構,項目團隊里大多是兼職的大學生,每人每天至少完成10條,日薪100元,超額完成按10元/條計。



      部分公司數據標注僅招聘兼職人員

      即便是專家級別的標注,性價比也很低。一位入駐某家國內大模型專家社區的在讀博士告訴小巴,自己在平臺上出題的時薪大約在100—300元,收入并不比家教等其他兼職有吸引力。他很快放棄了這份兼職。

      從招聘市場的薪資報價看,全職數據標注員的門檻水漲船高,但待遇低,在北京、上海這樣的地區,不少標注崗位要求研究生級別學歷,但月薪只有六七千元。

      ??其三,上升空間狹窄。

      一位AI產品經理向小巴介紹,他所在的頭部互聯網企業,標注崗位除了極個別管理崗位,其余均為外包,人員流動率極高,能待上超過一年的人并不多。

      雖然理論上,數據標注員可以依次向標注組長、質檢、質控、數據運營乃至算法類崗位發展,但因為技術類崗位的天然壁壘,真正實現的概率極低,絕大部分標注員會一直停留在原崗位上。

      ??其四,即使門檻被知識抬高,標注本質上還是一份極易被AI替代的工作,“教會徒弟、餓死師傅”。

      科技公司正在普遍采用合成數據減少對人工的依賴。比如,業內常見的降本手法“蒸餾”,即用ChatGPT等更高級的大模型生成的答案去訓練更初級的大模型。中小型大模型廠商大多使用這種方法,降低數據成本。

      因為這些原因,高端人才們進入標注行業,大多要么是尋求臨時過渡工作,要么只是作為兼職獲得一份收入,行業對他們難有長期吸引力。



      大模型巨頭開始“卷”數據

      問題的本質,是標注行業的社會認知和管理方式,都沒能跟上AI“知識饑渴”的速度。

      過去8年,數據標注行業經歷了巨大的變化。

      這曾經是個非常底層的工種。它興起于2017年前后,早期被廣泛應用于智能駕駛。那時任務簡單重復,比如框選圖片上的紅綠燈、汽車、障礙物。

      因為又苦又累,多年來,海外科技巨頭把這份工作轉移到勞動力最廉價的地區。牛津大學的一項調查顯示,全球有數百萬數據標注員集中在烏干達、肯尼亞等欠發達國家,他們每天工作9小時以上,時薪僅約1.16美元(約合人民幣8.3元),項目結束即失業。



      OpenAI合作外包公司Sama公司員工

      圖源:Sama公司官網

      在中國,數據標注產業主要聚集在中西部及三四線城市。在標注基地打標的員工,不少是待業青年、中老年人、殘障人士,只要會使用電腦即可。

      所以在大部分新聞報道中,數據標注員是一群AI世界里隱形的底層勞動力,在全世界欠發達國家、地區賺著“賽博流水線”上的微薄收入。

      但最近兩年,高端化的趨勢開始在海外興起。海外數據標注龍頭Scale AI,從2024年開始關閉肯尼亞、尼日利亞、巴基斯坦等地的承包站點,轉而招聘美國本土高學歷人士。

      據港媒報道,截至今年年初,Scale AI參與模型優化的人員中,12%擁有分子生物學等領域的博士學位,超40%擁有所在領域的碩士學位、法律學位或MBA學位。

      相較于時薪僅1美元出頭的低端標注,這些高端標注員平均時薪達到40美元。

      而對專家級標注員的投入也確實推動了公司的增長,Scale 2024年營收約8.7億美元,預計今年營收達20億美元。Scale AI創始人Alex Wang公開發言稱:“我們需要最優秀和最聰明的頭腦來貢獻數據?!?/strong>

      其競品、美國另一數據標注巨頭Surge AI,已經成為全球大模型追求高端數據時的首選。它把高質量的數據標注比作“寫詩”,組建了一支由哲學家、工程師、常春藤盟校畢業生等構成的標注團隊。

      而國內的高端化趨勢,很大程度上是從DeepSeek開始的。

      2023年起,DeepSeek開始招聘“數據百曉生”崗位,不限專業、不限經驗,實習生日薪超過500元,正職年薪可達百萬。崗位要求之一是“涉獵廣泛、博聞強識,對各行各業的知識都擁有強烈的興趣”。



      “數據百曉生”的主要任務,就是給AI出題、編寫“理想態”的優質答案作為學習資料、給AI生成的答案打分和調試,等等。

      結果也很驚人:DeepSeek上線7天用戶破億,靠文采飛揚、金句頻出和嚴謹的深度思考破圈,業內盛傳其標注團隊由北大哲學系的學生組成。

      此后,國內大模型界風向逐漸轉變,開始在“特級教師”上做文章。

      這種從“普通老師”到“特級教師”的需求變化,是AI進化到一定程度的必然結果。

      AI行業有句經典名言“Garbage In Garbage Out”,一個模型能力行不行,很大程度上取決于訓練模型的數據質量。據IBM的一項研究,僅注釋質量提高5%,就可以將復雜計算機視覺任務的模型準確率提高15%—20%。

      算法、算力、數據,是業內公認的AI三要素。頭部大模型們在算法和算力上難分伯仲,數據質量成了最有機會“卷”出差距的方向。



      AI變成精英以后?

      可以說,自數據標注被正式認定為職業,經過5年的發展,這個行業仍面臨著低壁壘競爭和勞動剝削等諸多問題,處于一個難以定性的狀態。

      但在每個新興行業出現、創造新工種的早期,都會出現類似的問題。所有的職業,都是先出現,再進化的。

      這份工作的前景也未必真如想象中渺茫。比如,它提供了一種職業轉型路徑:成了一條文科生在AI領域大展拳腳的神奇過渡帶。一些頭部大模型已經開始組建“AI人文訓練師”團隊,訓練AI識別“仇恨言論”和撰寫“高情商回復”。

      而這些文科生,也在這份工作中不斷觸碰AI與社會的邊界。小鵝說,在結束這份實習以后,她手機里的AI總是比別人的好用,因為理解底層邏輯,她更擅長下達精確的指令。

      這是個需要高質量人文社科人才的崗位,因為只有最善于思考人與世界關系的人類,才能教會AI怎么更好地做一個人。



      學習使用AI辦公技巧

      換個角度看,在高學歷人才該不該去“打螺絲”之外,還有一件事值得關注。

      在小鵝標注的上千條數據中,她印象最深刻的一條記錄是,一位用戶向AI提問“殘疾人患腦癌能不能進養老院”。小鵝翻閱此人的過往提問記錄,發現她向AI傾訴了很多自己各方面的困難,包括離婚、家暴、病重和無人贍養。但對于AI而言,這些提問不過是一條條平平無奇的數據流。

      當AI在頂尖老師的訓練下變得越來越頂尖,它就像一個含著金湯匙出生、接受正統通識教育的古希臘式精英,逐漸無法再看到更基層的需求。

      或許下一步,新的鯰魚就會從這些被忽視的需求中跳出來。

      *文中受訪者姓名均為化名

      本篇作者 | 溫若梅 | 責任編輯 |徐濤

      主編 |何夢飛| 圖源 |VCG、網絡

      驚艷、尖叫和思考,都會出現在這場AI大秀上!12月28日在廈門,吳老師將通過一場名為“AI閃耀中國”科技人文秀,把他在今年的“AI大調研”成果展現給大家~



      合作支持

      聯合出品:吳曉波頻道、優酷、七維動力、東南衛視

      官方AI助手:千問

      首席戰略合作伙伴:廈門國貿控股集團

      官方電商合作伙伴:天貓小黑盒

      超級品牌:飛書、金牌家居、雙鹿電池、東鵬瓷磚、聯想、影目INMO、1688、慕思集團

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      徐萌這身材絕了,難怪八旬范大師淪陷,換誰也扛不住

      徐萌這身材絕了,難怪八旬范大師淪陷,換誰也扛不住

      西門老爹
      2025-12-12 20:18:17
      許昆林、潘功勝、倪岳峰、唐登杰、龔正,出鏡《新聞聯播》

      許昆林、潘功勝、倪岳峰、唐登杰、龔正,出鏡《新聞聯播》

      新京報政事兒
      2025-12-12 22:08:11
      中國經濟年會:今年我國經濟總量預計達140萬億元左右

      中國經濟年會:今年我國經濟總量預計達140萬億元左右

      界面新聞
      2025-12-13 10:28:22
      顛覆認知!決定你壽命的第一要素,根本不是運動,也不是飲食!

      顛覆認知!決定你壽命的第一要素,根本不是運動,也不是飲食!

      徐德文科學頻道
      2025-12-12 22:58:58
      向遇難同胞致哀 南京全城鳴響防空警報

      向遇難同胞致哀 南京全城鳴響防空警報

      新京報
      2025-12-13 10:20:02
      格拉西莫夫因“謊報軍情”被解職

      格拉西莫夫因“謊報軍情”被解職

      名人茍或
      2025-12-12 17:02:25
      空調「銅管」時代終結!美的、海爾們如何用技術破局?

      空調「銅管」時代終結!美的、海爾們如何用技術破局?

      雷科技
      2025-12-12 19:46:10
      白宮發言人小嘴叭叭叭像開機關槍,俄烏、泰柬、日本都被她說了!

      白宮發言人小嘴叭叭叭像開機關槍,俄烏、泰柬、日本都被她說了!

      新民晚報
      2025-12-13 09:30:37
      上海女博士在家8年未出門,警察破門后,看到屋內景象頓時傻眼了

      上海女博士在家8年未出門,警察破門后,看到屋內景象頓時傻眼了

      詭譎怪談
      2025-05-02 00:08:52
      重磅:泰國F16戰機摧毀柬埔寨電詐園!大批從業人員逃離

      重磅:泰國F16戰機摧毀柬埔寨電詐園!大批從業人員逃離

      項鵬飛
      2025-12-12 20:00:56
      降雪后,北京一醫院6個半小時接診40例摔傷患者,大半骨折!醫生緊急提醒

      降雪后,北京一醫院6個半小時接診40例摔傷患者,大半骨折!醫生緊急提醒

      環球網資訊
      2025-12-12 22:09:06
      煙臺劉女士事件升級!又一商家發聲,涉案金額已超10萬,攤大事了

      煙臺劉女士事件升級!又一商家發聲,涉案金額已超10萬,攤大事了

      鋭娛之樂
      2025-12-13 08:56:27
      高德和交警聯網了嗎?網友:高德敢聯網,就會失去大量客戶

      高德和交警聯網了嗎?網友:高德敢聯網,就會失去大量客戶

      帶你感受人間冷暖
      2025-12-08 00:10:10
      國道重啟收費引熱議:燃油稅已交,為何還要再掏過路費?

      國道重啟收費引熱議:燃油稅已交,為何還要再掏過路費?

      胡嚴亂語
      2025-12-12 14:39:09
      一炮“送走”柬埔寨副司令,泰軍三軍壓境,不把洪森打服誓不罷休

      一炮“送走”柬埔寨副司令,泰軍三軍壓境,不把洪森打服誓不罷休

      大國知識局
      2025-12-10 22:21:12
      這款有人喜歡沒!我喜歡,不看前面我怕失望!

      這款有人喜歡沒!我喜歡,不看前面我怕失望!

      水泥土的搞笑
      2025-11-30 10:04:34
      志愿軍三個副司令,回國后三種命:鄧華跌得最慘,韓先楚穩坐23年,只有他活成了兩代上將

      志愿軍三個副司令,回國后三種命:鄧華跌得最慘,韓先楚穩坐23年,只有他活成了兩代上將

      文史明鑒
      2025-12-12 21:08:17
      不啃爛蘋果,才是渣叔的精明之處!

      不啃爛蘋果,才是渣叔的精明之處!

      葉赫那拉菲菲
      2025-12-12 09:11:01
      泰國發現情況不對,第三國勢力進場幫柬埔寨?泰軍用中文發表聲明

      泰國發現情況不對,第三國勢力進場幫柬埔寨?泰軍用中文發表聲明

      諦聽骨語本尊
      2025-12-12 22:22:34
      暴雪、寒潮、大風,中央氣象臺繼續三預警齊發

      暴雪、寒潮、大風,中央氣象臺繼續三預警齊發

      界面新聞
      2025-12-12 18:11:30
      2025-12-13 11:00:49
      估計快了我看了
      估計快了我看了
      富商大賈發送到
      31文章數 0關注度
      往期回顧 全部

      科技要聞

      比亞迪、小鵬、北汽,集體表態

      頭條要聞

      酒店員工侵犯女游客被刑拘 酒店方稱"兩人曾一起喝酒"

      頭條要聞

      酒店員工侵犯女游客被刑拘 酒店方稱"兩人曾一起喝酒"

      體育要聞

      有了風騷白人禿頭,忘掉談了10年的前任

      娛樂要聞

      保劍鋒方回應爭議,否認出軌贈送香水

      財經要聞

      鎂信健康闖關港交所:被指竊取商業秘密

      汽車要聞

      累計銷售84549輛 騰勢D9再獲1-11月新能源MPV銷冠

      態度原創

      家居
      本地
      健康
      教育
      公開課

      家居要聞

      溫潤質感 打造干凈空間

      本地新聞

      云游安徽|阜陽三朝風骨,傳承千年墨香

      甲狀腺結節到這個程度,該穿刺了!

      教育要聞

      最新,山東這地中小學寒假時間公布!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 超碰97在线免费观看| 欧美精品亚洲精品日韩专区| 久热re这里精品视频在线6| 亚洲性爱网站| 成人福利午夜A片| 铅山县| 欧美疯狂xxxxbbbb喷潮| 亚洲日本韩国| 亚洲春色在线视频| 欧美3P视频| 九九国产视频| 亚洲国产av无码精品无广告 | 制服.丝袜.亚洲.中文.综合懂| 扎鲁特旗| 亚洲精品一区| 成人3d动漫一区二区三区| 欧美videos粗暴| 中文字幕第56页| 亚洲无码21| 亚洲色av性色在线观无码| 精品素人AV无码不卡在线观看| 911国产精品| 久久9199| 国产伦精品一区二区三区| 国产亚洲精品日韩香蕉网| 亚洲欧美?va天堂人熟伦| 周至县| 成a人片亚洲日本久久| 亚洲精品国产一区黑色丝袜| 九九国产视频| 云和县| 亚洲欧美一区二区三区在线| 日韩一区二区三区三级| 中文字幕精品久久久久人妻红杏1| 日韩?人妻?精品| 浮妇高潮喷白浆视频| 成人av午夜在线观看| 亚州无码熟女| 亚洲综合电影| 久久九九久精品国产免费直播| 亚洲午夜亚洲精品国产成人|