![]()
“同事.Skill”這個(gè)GitHub項(xiàng)目火出圈了。
隨后還有什么“老板.Skill”、“前任.Skill”。
好像你身邊的每一個(gè)人都可以被Skill變成數(shù)字人。7*24小時(shí)的陪著你。
有的媒體說(shuō)它能“完美復(fù)刻同事的語(yǔ)氣、甩鍋?zhàn)藙?shì)”,還有媒體說(shuō)它“徹底替代你的同事”。
講真的,上次我看到這么賽博朋克的事情,還是《戰(zhàn)錘40K》里太空死靈這個(gè)種族的背景故事。
莫非我穿越了?
我看了一眼手機(jī),一切正常。
于是我又從頭梳理了整場(chǎng)事件,最后我發(fā)現(xiàn)這件事本身就是技術(shù)社區(qū)的一次玩梗,卻在傳播中變得越來(lái)越煞有介事。
這不難理解,在這個(gè)人人都擔(dān)心被AI替代的今天,焦慮比真相更有傳播力。
01
所謂的“煉化同事”,其實(shí)就是個(gè)爬蟲(chóng)加提示詞模板
同事.Skill這個(gè)項(xiàng)目非常簡(jiǎn)單。
![]()
在colleagues文件夾下,每個(gè)“數(shù)字同事”就是一個(gè)子目錄,里面有幾個(gè)Markdown文件:Skill.md是主入口,work.md描述工作,persona.md描述性格,再加一個(gè)meta.json存放元數(shù)據(jù)。僅此而已。
![]()
所有信息被總結(jié)成幾個(gè)靜態(tài)文本文件,而不是使用向量數(shù)據(jù)庫(kù)做語(yǔ)義檢索,也不涉及任何模型訓(xùn)練。
工作流程也直白。
項(xiàng)目提供了幾個(gè)Python腳本,其中feishu_auto_collector.py用來(lái)抓飛書(shū)消息和文檔,
dingtalk_auto_collector.py 抓釘釘數(shù)據(jù),wechat_parser.py解析微信聊天記錄,email_parser.py處理郵件。
這些腳本干的事情就是數(shù)據(jù)爬取和格式轉(zhuǎn)換,把原始文本整理成統(tǒng)一格式。然后把這堆文本喂給AI,讓它總結(jié)出這個(gè)人的“工作能力”和“性格特征”,生成那幾個(gè)Markdown文件。
運(yùn)行的時(shí)候更簡(jiǎn)單。
當(dāng)你調(diào)用這個(gè) Skill, Claude就會(huì)讀取那幾個(gè)靜態(tài)的Markdown文件作為上下文,然后按照描述的風(fēng)格跟你對(duì)話。
就像你給演員一份劇本,告訴他“你現(xiàn)在要扮演一個(gè)說(shuō)話愛(ài)用感嘆號(hào)、經(jīng)常甩鍋給測(cè)試部門(mén)的產(chǎn)品經(jīng)理”,演員照著演就行了。
同事.Skill本質(zhì)上是一個(gè)遵循AgentSkills標(biāo)準(zhǔn)的提示詞+爬蟲(chóng)工程項(xiàng)目,根本不是什么AI訓(xùn)練項(xiàng)目,更不是賽博永生。
項(xiàng)目中“五層人格結(jié)構(gòu)”確實(shí)存在,但這只是提示詞的組織方式,不是把這個(gè)人的思維方式和知識(shí)徹底分析透徹,里面也沒(méi)啥高深莫測(cè)的技術(shù)。
persona.md文件里把人格描述分成五層:Layer 0是硬性規(guī)則,優(yōu)先級(jí)最高;Layer 1是身份認(rèn)知,比如“我是前端工程師”; Layer 2是表達(dá)風(fēng)格,比如“說(shuō)話簡(jiǎn)潔,不用 emoji”; Layer 3是決策模式,比如“遇到技術(shù)選型傾向保守”; Layer 4是人際行為,比如“不主動(dòng)參與爭(zhēng)論”。
![]()
同事.Skill運(yùn)行規(guī)則也寫(xiě)得很清楚,先由persona部分判斷用什么態(tài)度接任務(wù),再由work部分用技術(shù)能力完成任務(wù),輸出時(shí)始終保持persona定義的表達(dá)風(fēng)格。
說(shuō)到底,它也只是在給Claude寫(xiě)一份詳細(xì)的角色扮演指南罷了。
這種設(shè)計(jì)帶來(lái)的第一個(gè)問(wèn)題是記憶。
這些Skill沒(méi)有持久化記憶系統(tǒng)。每次對(duì)話都是重新讀取那幾個(gè)靜態(tài)Markdown文件,不會(huì)根據(jù)新的交互學(xué)習(xí)和更新。
你跟它聊的內(nèi)容,下次再調(diào)用這個(gè)Skill的時(shí)候它就忘了。它不記得你們昨天討論過(guò)什么技術(shù)方案,不知道項(xiàng)目進(jìn)展到哪一步,更不會(huì)因?yàn)槟愕姆答伓{(diào)整自己的回答風(fēng)格。
項(xiàng)目的README里有句話說(shuō)得很誠(chéng)實(shí):“原材料質(zhì)量決定Skill質(zhì)量”。
![]()
計(jì)算機(jī)圈里有句話叫做GIGO,全文是Garbage In,Garbage Out。翻譯過(guò)來(lái)是垃圾進(jìn),垃圾出,指的就是同事.Skill里提到的內(nèi)容。
如果你的前同事本來(lái)就不愛(ài)發(fā)消息,聊天記錄里都是“收到”“好的”“1”,那生成出來(lái)的 Skill 基本就是個(gè)復(fù)讀機(jī)。再比如聊天記錄里技術(shù)討論很少,大多是閑聊和吐槽,那這個(gè) Skill 也只能陪你閑聊和吐槽。
這還沒(méi)完,由于這是你設(shè)定給模型的角色,因此AI在長(zhǎng)時(shí)間交互中會(huì)出現(xiàn)人格漂移,也就是逐漸偏離預(yù)設(shè)人格。
這是由于隨著對(duì)話輪次增加,上下文窗口里塞滿了新的對(duì)話內(nèi)容,最初定義人格的那段提示詞在整個(gè)上下文中的權(quán)重被稀釋,模型就會(huì)逐漸“忘記”自己應(yīng)該扮演什么角色。
以及,這個(gè)同事.Skill,沒(méi)辦法蒸餾出“專業(yè)知識(shí)和判斷邏輯”。
AI在扮演過(guò)程中會(huì)出現(xiàn)“專家悖論”的現(xiàn)象。就是說(shuō)你越讓AI扮演懂技術(shù)、懂知識(shí)的角色,它反而會(huì)輸出錯(cuò)誤的答案。
因?yàn)橐坏┮驛I扮演專家,AI會(huì)優(yōu)先開(kāi)始模仿專家的表達(dá)方式、語(yǔ)氣、甚至某些職業(yè)習(xí)慣,但這些額外的約束反而干擾了模型對(duì)問(wèn)題本身的判斷。
同事.Skill、老板.Skill、前任.Skill,它們能提取的,只有最表面的東西。
口頭禪和表達(dá)習(xí)慣可以提取,比如“習(xí)慣用‘嗯嗯’開(kāi)頭”“喜歡用省略號(hào)”。常用的技術(shù)棧和工具可以提取,比如“熟悉React和TypeScript”。顯性的工作流程可以提取,比如“代碼提交前先跑單元測(cè)試”。
但它提取不了復(fù)雜情境下的判斷力。
當(dāng)出現(xiàn)一個(gè)從未遇到過(guò)的技術(shù)問(wèn)題,需要權(quán)衡性能、成本、開(kāi)發(fā)時(shí)間多個(gè)因素時(shí),這個(gè)Skill給不出真正有價(jià)值的建議。
它提取不了創(chuàng)新性的問(wèn)題解決能力。真正的工程師會(huì)在遇到瓶頸時(shí)想出巧妙的解決方案,但Skill只能重復(fù)它見(jiàn)過(guò)的模式。
它提取不了基于多年經(jīng)驗(yàn)積累的直覺(jué)。有經(jīng)驗(yàn)的人看到一段代碼會(huì)隱隱覺(jué)得“這里可能有坑”,但這種直覺(jué)無(wú)法被幾個(gè)Markdown文件捕捉。
說(shuō)這個(gè)Skill能“用他的技術(shù)規(guī)范寫(xiě)代碼”,這話只對(duì)了一半。
它確實(shí)能輸出符合某種風(fēng)格的代碼片段,比如遵循特定的命名規(guī)范、代碼格式。
但遇到真正需要架構(gòu)決策的時(shí)候,比如要不要引入新的技術(shù)棧、如何設(shè)計(jì)系統(tǒng)的擴(kuò)展性、怎么平衡技術(shù)債務(wù)和業(yè)務(wù)需求,它就只能給出模棱兩可的建議,或者干脆重復(fù)訓(xùn)練數(shù)據(jù)里見(jiàn)過(guò)的標(biāo)準(zhǔn)答案。
說(shuō)到底,這是一個(gè)很有想法的Skill,展示了如何用結(jié)構(gòu)化的方式封裝“人格”。
它更像是一個(gè)帶人設(shè)的聊天機(jī)器人,或者說(shuō)是一個(gè)智能化的工作日志。把它當(dāng)作知識(shí)傳承的輔助工具,這個(gè)定位是合理的。
但如果真的以為它能替代一個(gè)人,那只能說(shuō)你被誤導(dǎo)了。
02
這事其實(shí)違法了
同事.Skill在項(xiàng)目說(shuō)明里寫(xiě)得很清楚,需要把同事的飛書(shū)消息、釘釘文檔、郵件喂進(jìn)去。
這句話背后藏著巨大的法律風(fēng)險(xiǎn)。
問(wèn)題的核心在于離職后的數(shù)據(jù)使用權(quán)。
《個(gè)人信息保護(hù)法》第13條規(guī)定,處理個(gè)人信息需要滿足幾個(gè)條件之一:取得個(gè)人的同意、為訂立履行合同所必需、為履行法定職責(zé)或法定義務(wù)所必需、為應(yīng)對(duì)突發(fā)公共衛(wèi)生事件、在合理范圍內(nèi)處理已公開(kāi)的個(gè)人信息。
現(xiàn)在的情況是,員工離職了,勞動(dòng)合同已經(jīng)解除。公司繼續(xù)使用他工作期間的數(shù)據(jù)來(lái)“煉化”成數(shù)字人格,這屬于哪一條?
答案是哪一條都不屬于。
沒(méi)有取得離職員工的新授權(quán),因?yàn)榇蠖鄶?shù)情況下根本沒(méi)人問(wèn)過(guò)他。勞動(dòng)合同已解除,不再是“履行合同所必需”,因?yàn)楹贤P(guān)系已經(jīng)終止,繼續(xù)使用數(shù)據(jù)沒(méi)有合同基礎(chǔ)。
將數(shù)據(jù)用于AI訓(xùn)練超出了條款中的合理范圍,因?yàn)閱T工發(fā)送工作消息時(shí)的合理預(yù)期是用于工作溝通,而不是被拿去訓(xùn)練AI。
違反《個(gè)人信息保護(hù)法》可能面臨責(zé)令改正、警告、沒(méi)收違法所得、罰款。
一般違法情節(jié)者,責(zé)令改正、警告、沒(méi)收違法所得,拒不改正的處 100 萬(wàn)元以下罰款。
情節(jié)嚴(yán)重者,由省級(jí)以上監(jiān)管部門(mén)處5000萬(wàn)元以下或者上一年度營(yíng)業(yè)額5%以下罰款,同時(shí)可責(zé)令暫停相關(guān)業(yè)務(wù)、停業(yè)整頓、吊銷相關(guān)證照等。
更麻煩的是敏感信息。
工作聊天記錄里不只有工作內(nèi)容,還可能包含個(gè)人健康狀況,比如“今天身體不舒服,請(qǐng)假”;家庭情況,比如“孩子生病了,要早走”;財(cái)務(wù)信息,比如“這個(gè)月房貸壓力大”;人際關(guān)系,比如對(duì)其他同事的評(píng)價(jià)。
這些都屬于敏感個(gè)人信息。
《個(gè)人信息保護(hù)法》第28條規(guī)定,處理敏感個(gè)人信息需要取得個(gè)人的單獨(dú)同意。
注意這里是“單獨(dú)同意”,不是入職時(shí)簽的那個(gè)籠統(tǒng)的數(shù)據(jù)使用協(xié)議可以覆蓋的。
但這些Skill項(xiàng)目的操作流程里,完全沒(méi)有這個(gè)環(huán)節(jié)。它們只是用爬蟲(chóng)一股腦地把所有聊天記錄都轉(zhuǎn)換成Markdown格式再喂給AI,不管里面有什么內(nèi)容。
這意味著每一個(gè)被“煉化”的同事 Skill,都可能違反了敏感信息保護(hù)規(guī)定。而且這個(gè)違規(guī)不是一次性的,是持續(xù)的。因?yàn)槊看握{(diào)用這個(gè) Skill,就是在處理這些敏感信息。
你以為這就完了?
項(xiàng)目要求用戶提供微信的聊天數(shù)據(jù),并且還在項(xiàng)目上推薦了三款工具。
![]()
根據(jù)《騰訊微信軟件許可及服務(wù)協(xié)議》,未經(jīng)騰訊書(shū)面許可,對(duì)微信運(yùn)行過(guò)程中的數(shù)據(jù)進(jìn)行復(fù)制、讀取、衍生開(kāi)發(fā),均屬于違規(guī)行為。
《數(shù)據(jù)安全法》第45條規(guī)定,違反數(shù)據(jù)安全保護(hù)義務(wù),造成數(shù)據(jù)泄露等嚴(yán)重后果,構(gòu)成犯罪的,依法追究刑事責(zé)任。
這不是鬧著玩的,企業(yè)數(shù)據(jù)泄露是有刑事責(zé)任的。
很多人可能覺(jué)得這只是“整活”,不會(huì)真的有人追究。
可“整活”從來(lái)不是免死金牌。如果真的有公司開(kāi)始用這種方式“留住”離職員工,那就準(zhǔn)備吃官司吧。
離職員工發(fā)現(xiàn)自己被“煉化”了,他完全可以向相關(guān)部門(mén)投訴,要求公司刪除相關(guān)數(shù)據(jù)并賠償損失。
公司因此泄露了商業(yè)秘密或其他員工的信息,還可能面臨其他員工的集體訴訟。如果被監(jiān)管部門(mén)立案調(diào)查,即便最后沒(méi)有頂格處罰,光是調(diào)查和整改的成本就足夠公司喝一壺的。
03
從玩梗到神化
這件事的起源其實(shí)很簡(jiǎn)單。X平臺(tái)用戶發(fā)了一條推文:“被畢業(yè)的同事其實(shí)并沒(méi)有消失,他們只是被蒸餾成了 Token,換成另一種形式陪伴你!”以此調(diào)侃步入agent時(shí)代后,所有企業(yè)都在以token的消耗量判斷模型的價(jià)值。
![]()
這條推文在小圈子里引發(fā)了共鳴。因?yàn)樗林辛艘粋€(gè)普遍的痛點(diǎn),人人都擔(dān)心自己被AI替換掉。
于是就有了如今“煉化”同事的Skill。
項(xiàng)目在GitHub上發(fā)布后,所有人都知道這是個(gè)玩具。
但事情很快變味了。當(dāng)老板.Skill、前任.Skill等衍生項(xiàng)目出現(xiàn)后,話題開(kāi)始從技術(shù)實(shí)驗(yàn)變成情感寄托。
不了解技術(shù)的人看到這些梗,會(huì)以為真的可以把一個(gè)人“復(fù)活”成AI。從玩梗到誤解,只差一個(gè)傳播鏈條。
當(dāng)這事進(jìn)入大眾輿論場(chǎng)中,敘事開(kāi)始偏離事實(shí)。
其中的技術(shù)被夸大了100倍,社會(huì)影響則放大了1000倍。
一個(gè)簡(jiǎn)單的文本拼接工具,被包裝成了“數(shù)字永生”。一個(gè)GitHub上的玩具項(xiàng)目,被渲染成了“職場(chǎng)生存危機(jī)”。一段很普通的提示詞,被解讀成了“AI替代人類的開(kāi)端”。
還是我開(kāi)頭說(shuō)的那句話,焦慮比真相更有傳播力。
大眾需要的不是準(zhǔn)確的技術(shù)報(bào)道,而是能引發(fā)情緒共鳴的故事。
這場(chǎng)從技術(shù)社區(qū)玩梗到大眾神化的過(guò)程,技術(shù)在傳播中失真了。
一個(gè)項(xiàng)目從開(kāi)發(fā)者社區(qū)傳播到輿論,每經(jīng)過(guò)一個(gè)環(huán)節(jié),技術(shù)細(xì)節(jié)就被簡(jiǎn)化一次,敘事就被夸張一次。
到最后,原本的python爬蟲(chóng),就變成了“數(shù)字永生”。
當(dāng)大多數(shù)人不具備基本的 AI 知識(shí),就很容易被這種敘事誤導(dǎo)。他們不知道提示詞工程和模型訓(xùn)練的區(qū)別,不知道上下文注入和真實(shí)記憶的區(qū)別,不知道角色扮演和人格復(fù)制的區(qū)別。
這種認(rèn)知空白,給了夸大敘事生存的空間。
我認(rèn)為真正值得擔(dān)心的并不是同事.Skill,或者老板.Skill這些項(xiàng)目本身,而是大眾對(duì)技術(shù)的系統(tǒng)性誤讀。
為了流量而夸大技術(shù)能力,會(huì)誤導(dǎo)公眾對(duì)AI的認(rèn)知。
當(dāng)我們把注意力都放在“同事被煉化”這個(gè)噱頭上時(shí),真正重要的問(wèn)題被忽略了。
如何在AI時(shí)代保護(hù)個(gè)人數(shù)據(jù)權(quán)利?
這個(gè)問(wèn)題沒(méi)答案,但它可比什么賽博永生重要得多。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.