![]()
淺友們好~我是史中,我的日常生活是開撩五湖四海的科技大牛,我會嘗試用各種姿勢,把他們的無邊腦洞和溫情故事講給你聽。如果你想和我做朋友,不妨加微信(shizhongmax)。
360想拯救與黑客作戰的100000個“帕魯”
文 | 史中
(一)鐵柱遍地走,大聰不常有
多年后的一天,當鐵柱低頭被領導訓斥的時候,也許會想起和大聰結伴回家的那個夜晚。
鐵柱來自一座北方十八線小城,畢業于名不見經傳的二本學校。
當初填報志愿兩眼一抹黑,二叔說搞計算機有前途,于是稀里糊涂地選了網絡安全專業,進入一家企業成為“安全工程師”。
第一天坐在工位前,他感覺自己是個飛行員,眼前懟滿了各個安全系統的告警日志。
帶他的師傅說:“你的任務很簡單,就是每天找出最危險的 100 條告警,然后順藤摸瓜,看看背后有沒有黑客在搞我們!”
鐵柱興奮了,像福爾摩斯一樣拿著放大鏡研究各種告警。但一周后他發現,大部分告警其實是誤報;另外一些告警看上去很可疑,但查了半天也沒搞清楚端倪,只好放在那兒;自己真正能搞懂并且能處理的威脅線索少之又少。。。
恰巧幾個月后,來了一位厲害的同事,大聰。
這哥們名校畢業,對網絡安全的理解很深刻,說話又好聽。鐵柱每天圍著大聰詢問各種安全系統的使用方法,大聰也不吝賜教。
可是鐵柱很快發現,他跟不上大聰漂移過彎的思路。。。
大聰一會兒就能搞定的事兒,他要搞到很晚才勉強弄完。那天兩人加班到夜里,結伴回家,鐵柱看到萬家燈火,心里一種說不出的滋味。
又過了幾個月,大聰辭職了。聽說被一家專門做網絡安全的公司給挖走了。那一刻鐵柱也想走,可冷靜想想自己的能力,還是留下了。
日子一天天過,鐵柱當上了小組長,但肩上的擔子越來越重。
他所在的企業數字化改造加快,越來越多關鍵數據都存在網絡空間里; 國家《網絡安全法》《個人信息保護法》依次實施,數據一旦失竊,后果重大; 偏偏國際形勢、經濟形勢都變得越來越嚴峻,黑客攻擊事件越來越多。
幾年前有些告警不處理也就過去了,但現在。。。天知道哪條告警背后就藏著國際大黑客,手一哆嗦沒準就是幾十億上下的損失。。。
企業于是開始組織內部的“網絡安全演習”,找來“攻擊隊”測試鐵柱團隊的守衛效果。
鐵柱團隊都是中規中矩的安全工程師,沒有什么大神,他們只好輪流“守夜”,結果不知道啥時候,還是被攻了進來,底褲都被攻擊隊偷了去。
領導興師問罪,鐵柱本想反駁兩句,想想房貸車貸奶粉錢,低頭不敢吭聲。
![]()
故事先停在這里。我們不妨跳出來,站在岸邊看一下歷史的潮起潮落。
歷史上每一場新技術革命后,都會產生很長時間的“排異反應”——由于新技術、新工具本身還不夠成熟,學習、使用它們的腦力成本很高,產業中的大部分普通人是沒辦法適應的。
一個殘酷的事實是:
此刻不僅在網絡安全領域,在各行各業都有無數“鐵柱們”在掙扎。
他們無意偷懶,他們也想成為更好的自己,只因為他們是普通人,能力有限。在變幻莫測的科技浪潮里大口嗆水,漫無目的地“卷來卷去”。
正如帕魯,你不干有的是帕魯干。
![]()
我說的不是別人,恰是你我。
毫不夸張地說,“鐵柱”原本就占據了人口的 80% 以上;而環境還在迅速變化,那 20% 原本不是鐵柱的人也正在變成“鐵柱”。。。
![]()
鐵柱被埋在泡泡里,夠不到那些先進的工具和技術。
可是,正如黃燈在《我的二本學生》中所說:“他們是和腳下打的黏附最緊的生命,是最能傾聽到祖國大地呼吸的年輕群體···他們實現人生愿望的可能性,是中國最基本的底色,也是決定中國命運的關鍵。”
咱們說回網絡安全領域。
雖然事關國家的安危,但現實是:像“大聰”那樣高端的網絡安全人才極度稀缺,守衛安全的中堅力量只能是無數的“鐵柱”們。
現在中國的網絡安全從業者大概有10萬人,其中相當一部分在做最基本的網絡安全運營工作。
網絡安全 運營工程師的“腦力極限”就像一個泡泡,禁錮著自身的可能性,也禁錮著這個國家的“安全紅線”——怎么穿破普通人“腦力極限”的泡泡,事關興亡,茲事體大。
老淺友都知道,我一直熱切地相信,人工智能,就是能刺破我們頭腦泡泡的“白衣騎士”。人工智能“大模型”問世以后,我更加堅定了這個信念。
但是我也知道,僅僅對 AI 技術的吹捧無益于事。
真正能創造出一套接地氣的框架,一邊連接 AI 和具體的工具,一邊連接鐵柱——讓“鐵柱”不用復雜的學習就能被 AI 加持,輕松地升級成“鐵柱 AI Plus”,這才是在推!動!歷!史!
![]()
但如何從兩手空空到手握利劍?
中間的路正如迷霧覆蓋的游戲地圖,無數技術人不知要用血肉之軀突圍多少次才能走出來。
坐在我面前的潘劍鋒,就是這么一個正在艱苦突圍的人。當然他并不孤單,他背后是 360 公司,以及 360 數字安全團隊的幾百位技術小伙伴們。
![]()
潘劍鋒
(二)“鐵柱 Plus”
“你們究竟怎么用 AI 幫助各大企業的網絡安全工程師呢?”我一上來就直接靈魂拷問。
潘劍鋒想了想,覺得要回答這個問題,還是要從頭闡述一下 360 思考這個問題的底層哲學。
搜索引擎的誕生,讓人們獲取信息的成本趨向于零。 大模型的誕生,讓人們獲取知識的成本趨向于零。 智能體的誕生,會讓人們獲取技能的成本趨向于零。
這三句話啥意思嘞?不妨用“魚香肉絲”做個比方。
假設有個老外美食家叫漢尼拔。
漢尼拔從來沒吃過中餐,他通過谷歌搜索了一下“魚香肉絲”,這時他就明白了魚香肉絲是個啥樣,這就是獲取信息。
![]()
但他還沒吃過魚香肉絲,決定自己做一下這道菜,于是去問 ChatGPT,魚香肉絲怎么做?
ChatGPT 告訴了他詳細做法步驟,這就是知識。
![]()
但你猜怎么著?他還是不會做。
因為 ChatGPT 提到了生詞,例如要用到“泡紅辣椒”、“水淀粉”;還提到了陌生的動作,例如“鍋中放少許油”、“爆炒”,這些背后都隱含了很多細節信息和實踐經驗,超出了他在“中餐領域”的能力和認知邊界。
漢尼拔沒有炒菜的 技能 ,在魚香肉絲面前,他就是鐵柱!
![]()
咋辦?簡單啊,去中餐館,點一盤魚香肉絲,讓大廚發揮技能直接給他做就行了。
你看到了嗎?最后幫助這個老外的,不是信息,也不是信息編織成的知識,而是知識編織成的“技能”。
![]()
說回來,剛才潘劍鋒提到了一個關鍵詞——“智能體”。
這是啥嘞?
簡單來說,掌握某種“技能”,并且能用這種技能幫助人類完成(與智能相關的)“特定任務”的那個存在,就叫“智能體”,它的英文叫“Agent”。
不過在“魚香肉絲”這個例子里,“炒菜”是個物理技能,得有手有眼才能干,想讓智能體掌握這種技能,得先造出一個有手有眼的機器人。
這以目前人類的技術水平還比較困難,只能讓“碳基智能體”——人類大廚——代勞。
但在很多 IT 領域,比如“網絡安全”,所有的攻防戰斗其實都發生在虛擬世界,不涉及和物理世界的互動。
所以只要能針對某個威脅做出應對策略,并且調用虛擬世界的工具一步步踐行這個策略,它就是一個優秀的“網絡安全智能體”!
這樣的“網絡安全智能體”,足夠幫助鐵柱做好網絡安全的運營工作,讓他變成“鐵柱 Plus”!
![]()
說到這,可能有的淺友還有點懵:去年出來的“大模型”我還沒搞明白,又來了個“智能體”,他倆到底是啥關系?
其實很簡單,我借用周鴻祎的比喻來說吧:
如果說大模型是一個發動機,智能體就是一輛整車。
對于大部分普通人來說,給你個發動機,你當然知道這玩意兒非常精密,代表人類文明最高水平,但它對你來說就是沒用。。。(這就是為啥 2023 年大模型炒得那么熱鬧,但是普通人卻感覺和自己沒啥關系。。。)
但是,給你一輛包含發動機的整車,你馬上就知道它有用。你可以用它實現特定目的,比如上班、旅游。
也就是說,智能體是:
1)包含了大模型的系統;
2)用途更明確的系統。
所以說,工程師們究竟能把“智能體”做到啥程度,才真正決定了這一輪人工智能大模型的爆發能在多大程度上改變全世界 80 億人的生活。
![]()
那,現在的“智能體”技術足夠支棱嗎?!
這得看和什么比。
話說,人類對于智能體的想象,基本都來自于科幻小說。
科幻小說里那種“機器人”,就是智能體的高級形態。你讓它唱歌跳舞也行,讓它炒菜做飯也行,甚至它不爽了還能反叛呢。。。
這種科幻想象,默認了智能體具有執行“通用任務”的能力。
![]()
但是說實話,以目前 2024 年的人類技術水平,還遠遠做不到科幻小說里的“通用”,只能專門為特定的任務調教一些智能體,比如“幫我收集新聞的智能體”、“幫我安排日程的智能體”。。。
越是聚焦的任務,智能體做得越好。
那么問題來了:
幫助網絡安全工程師做安全運營工作的智能體,能不能被做出來呢?
網絡安全運營,這個工作聽上去挺聚焦,但其實相當寬泛。
因為網絡對抗本來就很像打仗,兵者詭道也,你不知道對面的黑客會使出什么招數。
對方出倆王四個二,你得打七對十三幺。。。所以,“網絡安全智能體”反而是所有智能體里非常難的一種。
壓力給到潘劍鋒!
故事還得說到 2023 年 6 月,當時 ChatGPT-4 正在風口,360 也訓練了自己的大模型,也就是“360 智腦”。與此同時,國內外也有一些重磅的大模型陸續開源,比如 Meta 的 Llama。
但實話說,無論是領先的 ChatGPT 還是一眾跟隨者,大家的模型水平都是一言難盡——直說吧,很弱雞。
說到這,可能有人不同意:
“你說中國的大模型弱我同意,但 ChatGPT-4 我用過,回答問題井井有條,你怎么能說它弱呢?”
這是因為,很多人詢問 ChatGPT 的問題是“單步問題”。比如“康德的主要思想是什么?”或者“幫我寫一首有關春天的詩。”
大模型只要針對這個問題冥思苦想就夠啦!這種情況 ChatGPT 可以做得不錯↓↓↓
![]()
但是,現實生活中對我們生活質量產生重大影響的幾乎都是“多步問題”。
比如“我喜歡一個女生,她叫李逵,我要干什么才能追到她?”
我不相信你只做一件事兒就能追到李逵,你得精心策劃一套劇本 :
起碼得有“偶遇鐵牛”、“展現倒拔垂楊柳的能力”、“送她兩壇好酒”、“陪她劫法場”、“表白”等等很多章節,每個章節里面還得有幾個小標題。。。一套組合拳下來,才有可能追到李逵。
如果拿這種多點問題去問 ChatGPT,你得到的一定是一個很籠統的答案,什么“積極交流”呀,什么“提升自己”呀,沒有可操作性。
這才是大模型“弱”的地方 ↓↓↓
![]()
做網絡安全運營,智能體面對的可都是“多步問題”。
比如你從一條告警開始,要先找到導致告警的黑客動作,再探尋黑客在這個動作之前還做了哪些動作,甚至要找到黑客利用了哪些漏洞,還要溯源黑客的來頭,分析他的目的,寫成完整的報告,同時拔掉黑客在網絡里埋下的釘子,徹底把他攆出去。
你跟大模型籠統地問:現在我看到了一條告警,我想攆走黑客,應該怎么辦?
哪怕是地表最強的 ChatGPT-4 也根本答不上來。
幸好,模型“弱”有模型“弱”的辦法!
潘劍鋒說。
他所說的辦法,就是構造一個合適的“智能體框架”!
剛才說過,大模型是發動機,智能體是車,那么智能體框架,就是“除了發動機以外的汽車框架”。
發動機功率不好的時候,通過提高傳動效率,設計精巧的結構,還是能造出一臺車的!這樣一來,等到發動機自身升級了,直接替換掉舊發動機,整車性能不就瞬間爆棚了嗎?!
懷揣這種現實主義的思路,2023 年初夏,潘劍鋒和一眾老師傅上路了。
(三)使用工具不再是人的專利
要說清這個“智能體框架”,咱們得想象一個畫面:思維鏈。
既然大模型在“解決單點問題”上能力還行,在“總體任務規劃”上比較弱。那我們能不能把事情拆開?就讓大模型解決一個個單點問題,而把任務規劃交給另一個模塊來做?
這樣,解決一個網絡安全問題的框架就變成了下面這樣:
![]()
不同的小問題,串成了一個“思維鏈”。
每個小問題都解決了,思維鏈也就推導到了最后一步,總任務完成!
這時,一個巨大的難點出現了:
“思維鏈”上的每個步驟的“問題”并不相同:有的步驟是大模型純靠思考就能解決的,很多關鍵步驟是大模型必須調用安全工具才能解決的。
那怎么才能保證大模型用正確的姿勢使用工具呢?
咱們就拿上圖來說,那條思維鏈上的第 3 步,是要通過“360 威脅情報系統”這個工具來查詢某個 IP 地址有沒有犯罪前科。
那么,我就得保證這一步的大模型會用這個工具:
1)知道“360 威脅情報系統”是干啥的; 2)知道用什么命令,才能從“ 360 威脅情報系統”里把數據給查出來。
這里的方法就有兩個了:
一個是“現學現賣”,一個是“提前培訓”。
所謂 “現學現賣” ,就是思維鏈已經推進到這一步了,現場告訴大模型有“威脅情報系統”可以用,并且把使用說明書給大模型看,讓它一邊看著操作說明一邊查詢。
拿到結果,交給思維鏈的下一步。這波任務結束,它就可以把工具的使用方法給忘了。
就像醬↓↓↓
![]()
所謂 “提前培訓” ,就是提前給大模型上課,把 360 各種安全系統的操作指南都給大模型預先學習,這就是“模型精調”。
把精調過的模型放在思維鏈上,它就已經掌握了對很多系統的操作技巧。此時,直接告訴它應該查詢“威脅情報”,它就會查到結果,交給下一步。這次任務結束,它仍然記得這些工具的使用方法。
就像醬↓↓↓
![]()
按理說,“現學現賣”和“提前培訓”都可以,而且“現學現賣”反而更簡單。
但這里有個巨大的問題,那就是大模型的“輸入窗口”有局限。
簡單來說就是,你一次給大模型輸入的信息不能太多,按照 2023 年夏天的技術發展水平,雖然不同模型有所差異,但基本都在 1k-8k Token,你可以理解為,一次只能給大模型說“8000 個詞”。
這就造成了,如果“現學現賣”,思維鏈上的每一步都只能執行簡單的操作。因為稍微復雜一點兒,你光教大模型用工具,已經超了 8000 詞,都來不及布置任務了。。。
潘劍鋒他們權衡之后,決定用“集中培訓”的方法。(后來的事實證明,他和大部分友商走了不同的路線。)
但老師傅們越培訓越發現,難度比想象中要高,這主要是因為大模型有個內生“Bug”——災難性遺忘。
也就是說,你給它學越多專業知識,它就可能遺忘越多通識;你給它學越多 A 方向的專業知識,它就可能忘記 B 方向的專業知識。(其實人也有這個毛病,比如很多數學家在生活上都比較低能,比如很多大文豪卻數學不及格。。。)
只有一種方法可以減輕“災難性遺忘”,那就是教大模型的“老師”和“教材”要非常厲害。
所謂厲害,就是把所有網絡安全系統抽象成高度統一的邏輯,表面上大模型學習的是 A、B、C、D、E 五種系統的知識,本質上它學會的都是同一種安全運營的思路。
![]()
抽象的層次越高,意味著老師要對網絡安全的理解越透徹,當然也就越難。但既然選了這條難的路線,跪著也得走完。
況且 360 作為網絡安全界的大佬,要是干砸了,實在丟不起那個人啊!
老師傅用幾個月的時間,把他們近二十年來和黑客組織你來我往實打實的 對戰經驗 和 運營秘 籍 總結成成一套精巧的《九陰真經》,推著大模型的后背,總算把“內力”給傳輸進去了。
這時,潘劍鋒和 360 老師傅們終于能擦擦汗——在那張大圖上,“大模型”和“工具”之間的磨合總算是順滑了。
![]()
潘劍鋒告訴我,到了 2023 年 8 月,360 安全大模型已經學會了幾十款產品中幾百個接口( API)的調用,而且保證每次調用都是準確的。
于是,360 在 ISC 大會上順勢發布了“360 智控系統”。
等等?!為啥叫“智控系統”,不叫“安全智能體”呢?!
這個名字背后,其實隱藏了智能體的另一個巨大的難點。
你有沒有發現,剛才我們只解決了“大模型”和“工具”之間的配合,但是一直沒說“任務規劃”是如何進行的。
![]()
其實,在 2023 年 8 月的時候,即便 360 在大模型安全系統上已經很領先了,但是在“任務規劃”這個層面上,做得依然不夠理想。
這個難點的表現是:思維鏈很難做長。一旦規劃了一條比較長的思維鏈,就有可能出錯。
所以,為了保證系統的功能準確,只能把思維鏈限制得較短。
如此,這個系統的突出特點就是“自然語言控制”:比如我說讓系統幫我查一下某個威脅情報,大模型就理解了我的意思,然后調用威脅情報系統去查詢;比如我讓系統幫我解析一下這個告警,它就去查詢這個告警背后的關聯信息,然后用自然語言解釋給我聽。
團隊比較實事求是,干脆起了個保守的名字,就叫“智控系統”。
但問題來了,潘劍鋒拿著“360 智控系統”去客戶那安利,甲方的領導提出了一個致命的問題:
“如果我花了上百萬買了你的這一套包含大模型的系統,結果只是方便了一點點,我為什么要投入?”
換句話說,如果你的系統以智能控制為最大賣點,那究竟能給我的安全團隊多大的加持呢?我買你的系統“投入-產出”劃算嗎?
你看, 這個問題立刻回到了我們在第一章強調的:公司安全運營團隊里有很多“鐵柱”,他們最需要的不是單點對安全系統的智能控制,而是一整套運用安全系統保衛網絡的“技能”。
想明白這一點,潘劍鋒回到辦公室,他知道團隊只有沉下心來死磕一件事兒,那就是: 把思維鏈做長 。
而且,在增加思維鏈長度的同時,必須保證專業性和準確性。
![]()
(四)思維鏈:一寸長,一寸強
思維鏈的起點,是事情現在的樣子;思維鏈的終點,是我們的目標。
所以,目標是“切近”還是“遠大”,其實就決定了思維鏈的長短。
舉個栗子:
現在我就是個智能體。
如果我的目標是:解渴。
那么我的思維鏈可能就是:找到面前的水杯,抓起水杯,送到嘴邊,喝下去。
你看,這個目標就是切近的目標,思維鏈短,也很清晰,容易規劃。
如果我的目標是:賺到 1 個億。
那么我的思維鏈可能就是:好好學習,結交靠譜的朋友,找到好工作,出任總經理,創業做 CEO,做大做強,賺到 1 個億。
你明顯能感覺到,這個目標很遠大,思維鏈很長,并且每一步都還可以分為更具體的 思維鏈,這樣的規劃即便是人都很難做到,何況 AI 乎?
一個網絡安全智能體面對的目標一般都比較遠,咋辦嘞?
這里要提到一個有趣的技術細節:
在市面上已有的智能體技術中,這個任務規劃模塊是由人工智能(大模型)來全權承擔的。
但潘劍鋒經過實驗發現,網絡安全的眾多任務規劃模塊如果純純交給人工智能,很多鏈條是連不上的。所以這個模塊應該是“人類智能”和“人工智能”共同驅動的。
具體來說是醬的:
1、360 的安全老師傅們坐在一起,研究出針對很多具體目標的“劇本”。這些劇本其實就是預制的思維鏈。一旦用戶提出這些目標,那么就直接走劇本。 2、同時模塊里還有一個特制的大模型,專門負責生成沒有預制劇本,也就是“通用任務”的規劃,但這個大模型也不是憑感覺亂規劃,它會參考一份《葵花寶典》,也就是 360 老師傅們總結的“黑客技戰術大全”和已發現的“高級威脅組織”。
![]()
你看,無論是走預制劇本還是現場寫劇本,最后之所以能把思維鏈做長做準,都是因為背后都融入了 360 這些年的安全經驗積累。
“把 360 的獨門絕技放進去,才讓我們做出的安全智能體有一道很深的護城河!”潘劍鋒說,“當然,也不能說 360 的劇本庫就完全適合每家企業,客戶也可以通過我們準備的“低代碼平臺”,用拖拽的方法設計他們的本地劇本,添加進劇本庫。”
![]()
故事進展到這里,主要問題都被解決了。對吧?
不對。
此時安全智能體的表現雖然說的過去,但仍然被一個“看不見的天花板”所阻擋。
當時,這個問題是以非常不經意的姿勢出現的:
360 的老師傅發現,對于人類來說順手的“安全工具”,智能體用起來并不順手。
這導致了另一個更大的問題:安全專家心里那么多牛X的經驗,沒辦法原汁原味地傳授給大模型——傳授的過程中總要打個折扣。
仔細思考,問題就更嚴肅了:雖說 AI 是仿照人類大腦研發的,但畢竟人類和 AI 是兩個物種,大模型在思考的邏輯性上比人有劣勢,卻在思考穩定性上比人類有優勢。
這么說的話,適合人類的安全工具,也許并不適合 AI 智能體,反而應該為智能體開發一些它們專屬的工具?!
被這個想法種草之后,老師傅豁然開朗。
歷史上早有教訓:
在云計算興起初期,人們的第一感覺自然是把原來的軟件系統搬到云計算上;但是云計算成熟的過程中,越來越多工程師意識到,應該為云這種基礎架構開發專屬的軟件系統,才能充分發揮云的優勢。于是,出現了“云原生軟件”。
如此觀之,未來的方向很可能是:“大模型原生”的系統。
對于 360 數字安全來說,就是“大模型原生的安全運營系統”。
所謂大模型原生,用白話說就是:不要讓大模型去適應原有的安全運營體系,而是把安全運營體系的所有模塊都變成能適應大模型的!
想清楚這些,潘劍鋒立刻調動團隊的幾百位工程師,調整他們手里的幾十款安全產品的接口,讓大模型更容易控制。
![]()
有了“大模型原生”這個方向,很多原本覺得天經地義的事情,此時都成了老師傅的“眼中釘”,亟待被改變。
潘劍鋒又給我舉了一個例子:
在很多劇本里,都涉及到一個具體步驟,那就是“異常行為檢測”——就是說,判斷這個程序正在表現出來的行為,到底是正常的,還是異常的。
過去,由安全工程師來完成這個“檢測”,他需要動用自己的經驗,結合一些檢測工具,才能能給出判斷。
這個工作算是“單點任務”,理論上可以由大模型自己來完成。
可是,大模型相比人腦而言,思路沒那么清晰,如果一味模仿人的做法,效果很難提升。那為什么不用“大模型原生”的思路,揚長避短,用大模型優勢的一面來完成這個工作嘞?
于是,潘劍鋒他們對執行這個步驟的大模型做了深度“魔改”,利用大模型的一些工作特點直接判斷這個行為是正常的還是異常的,效果一下子就突破了瓶頸。(由于這里涉及很多技術獨創,潘劍鋒特地囑咐我別說太細致。。。)
![]()
把一些大模型從結構上進行改造,更能適應特定的任務。
說到這,整個故事的脈絡已經浮現出來:
最初,客戶提出了“智控系統”對人的幫助不夠大的問題,于是 360 的老師傅要把思維鏈做長; 在把思維鏈做長的過程中,老師傅意識到可以把 360 這些年積累的獨門秘籍都塞進去; 在塞獨門秘籍的過程中,老師傅遇到了一些困難,他們發現要想把人類經驗完全塞進去,需要首先把一整套智能體的框架都改成“大模型原生”的; 為了實現“大模型原生”,老師傅把底層的工具進行了全部改造,還把執行特定任務的大模型做了改造,相當于把整個系統按照新的范式重構了一個遍!
這條故事脈絡,其實是科技產品創新的標準劇情:
1)技術是有力量的;
2)但單點的技術突破力量有限,很難顛覆現有秩序;
3)只有進入“范式的重構”,把新技術按照新范式排列在一起,才能形成合力,在地層上扎牢根系,帶領新世界一騎絕塵。
說回我們的故事,所有這些做完,已經到了 2024 年 1 月。
是騾子是馬,得拉出來遛遛了。
![]()
(五)天下武功,唯快不破
潘劍鋒穿著“王子復仇”的華服,殺回到幾家大企業客戶那里:
你們要的“技能”來啦,看看智能體究竟能幫你們的“鐵柱”做多少事情!
系統同時部署在幾家企業里做測試。究竟能不能抓到黑客,其實潘劍鋒心里也有點打鼓。。。這倒不是對技術沒信心,而是萬一在測試階段沒有黑客進攻,智能體只能做日常巡檢,搞不了“大新聞”啊。
也不知是幸運還是不幸,幾天之后,在一家大型金融企業里,緊張的情節突然開始上演:
這家企業的財務部同事收到一封郵件,標題顯示,是有關“Paypal 海外支付”的。
![]()
(當時用戶并沒有截圖,內控制度也不允許截圖,這是后來 360 老師傅根據現場復現的)
由于這家企業有很多海外業務,收到 Paypal 的郵件再正常不過了,所以這個同事沒有多想就點開了郵件附件。
附件是一個 Word 文檔,里面幾乎都是韓文內容。
![]()
這位同事覺得可能是 Paypal 發錯了,或者后續還會有英文版內容發過來,也沒多想。
可是就在幾秒鐘后,部署在網絡中的 360 本地安全大腦彈出了一條告警。
這條告警不僅推送給了企業安全運營團隊,也同時推送給了時刻待命的 360 安全智能體。
360 安全智能體用了十秒左右的時間對任務進行規劃,然后按照規劃一步步執行:
1、它根據告警,找到了導致告警的病毒文件,并且把這個文件里的代碼侵入這臺主機的全過程日志都做了摘錄。
2、 根據 360 的研判,記錄下了它的全部行為特征:利用模板注入,投放宏病毒,將竊密模塊注冊為系統服務,收集敏感數據,通過網絡傳出。
3、用這個行為特征去 360 的威脅情報庫查詢,結果是,它和 360 記錄在案的一個位于朝鮮半島的“高級威脅組織” APT-C-28 的相似度達到了 99%。
4、智能體馬上拿著這個高級威脅組織的行動特點,在企業的內網里開始拉網式搜尋,發現受感染的主機已經不止最初的那一個,而是擴散到了另外四個,分別是:“cmdb 資產161”、“DNS 服務器”、“GQQ”、“Web 服務器”。這些資產可都是和業務相關的!
5、根據這些結果,用大模型自動書寫一份調查報告,同時生成一份處置建議。
6、調查報告和處置建議一起被發送給安全運營人員,他們做最終研判,可以點擊按照處置建議執行,也可以修改或添加其他處置行動。
7、至此,對這條告警的“圍獵”結束,智能體回歸待命狀態。
![]()
在最后的報告里,“安全智能體”追溯出了黑客完整的攻擊路徑。
這個故事里,讓潘劍鋒覺得驕傲的,不僅是 360 安全智能體正確操作了整個“威脅獵殺”的思維鏈,還有它完成整個操作的過程只有不到 1 分鐘。
我們不妨再回到攻擊的開始,就在財務同事點開帶毒文件的一瞬間,其實就像一個 發令槍 ,安全人員和黑客開始了 “奪命賽跑” 。
每一秒,黑客都在網絡里沖殺,試圖感染更重要的主機,盡可能把重要的信息傳輸出去。這些信息不一定是企業核心數據,更有可能是某些子系統的登錄密碼,網絡拓撲結構等等。
只要黑客拿到了這些信息,哪怕這波攻擊被安全人員發現,殺掉了病毒進程,它依然是成功的——因為黑客可以利用竊取到的密碼和網絡結構信息,擇良辰吉日卷土重來。
黑客掌握的信息越多,就越不容易被安全系統發現。于是,很可能每一次黑客都可以在之前的“成果”上再推進一點點,直到最后拿到核心機密。
而安全人員要做的事情,就是趕在黑客拿到某些信息并且把它傳輸出去之前就干掉病毒,并且把病毒構建的對外傳輸通道徹底堵死。
這種攻守天平非常不穩定,每推遲一秒,都可能向黑客的方向傾斜。這種傾斜,是無可挽回的!
由此,我們再回看整個威脅獵殺的過程,只用了不到 60 秒,你就能明白這個事實有多鋒利。
如果交給高級安全人員,當然也能分析出和智能體相同的報告,甚至比智能體發現更多的蛛絲馬跡,報告寫得更準確,但是有一點可以肯定:人類的用時必定超過安全智能體。
真正的武林對決中,你的功夫再扎實,如果出拳太慢,還是會敗,正所謂——“天下武功,唯快不破”。
由此,智能體終于展現出了“大模型原生范式”的光芒。
![]()
就在老師傅們為自己手造的奇跡歡呼時,在其他測試企業里,智能體也發現了其他的黑客進攻行為。
但潘劍鋒決定不給我透露更多的案例細節。
他的意思是,雖然 360 的老師傅們做了很多努力,但是畢竟產品剛剛成熟,還要經歷在客戶運行環境中的磨合。
況且潘劍鋒覺得,安全智能體是一個非常有挑戰的新技術,就在過去幾個月間,團隊克服了很多友商還在苦苦思索的難題,有了一定的優勢,但如果潛心努力,優勢還能進一步擴大,此時還是低調為妙。
我很能理解他的心情。
如果從天空俯瞰,這一輪人工智能大模型的爆發會重構千行百業,而重構的具體過程,就是通過千百個“智能體”來實現的。
在網絡安全領域,誰拿下了“智能體”的高地,就相當于擁有了降維打擊的能力,這會影響至少未來 10 年的競爭格局,當然要審慎再審慎。
智能體能寫劇本,人當然更能寫劇本。
如果說 360 數字安全的發展也有“劇本”的話,那我猜這幫老師傅給自己寫的劇本就是——偷偷努力,然后驚艷世人。
潘劍鋒告訴我,如果未來大模型的能力進一步增強,那么規劃的任務也可以脫離“預制劇本”,更多地交給模型去自動生成。
在我看來,這就是規劃層的“大模型原生”。走到這一步,智能體距離科幻電影就更近了一些。
![]()
(六)鐵柱的責任
臨近告別,潘劍鋒不經意間說了一個事情。
在他看來這是天經地義的,卻猛地撬開了我思考的閘門。
這就是:智能體是“獨立的”。
一個客戶,可能買了 360 的主機防護系統,可能買了 360 的防火墻,也可能買了能匯集所有安全系統信息的“本地安全大腦”。
這些系統完全可以完全沒有“智能體”介入,由安全運營人員去操作; 智能體也可以獨立操作“主機防護系統”、“威脅情報系統”、“本地安全大腦”; 智能體也可以同時操作所有的產品。
從這個層面上講,智能體是“獨立”的。
這種獨立,是人獨立于工具的那種獨立。
這個事情的奇妙之處在于:我們都知道“智能體”本來是一行行的代碼,和那些同樣由一行行代碼組成的工具更為類似。但在生態位上,智能體卻和人的地位更相近。
![]()
智能體獨立于所有的工具。
正是這種生態位的相近,讓智能體可以和人融合,把鐵柱變成“鐵柱 Plus”。
看到這里,很多人會有警覺:鐵柱 Plus 繼續發展,會不會有一天鐵柱沒了,只剩下“Plus”?
其實,從 360 的智能體里,我們已經可以看到一些端倪:
潘劍鋒他們把智能體的思維鏈做了個限制,最遠只到:給出操作建議。
為什么 AI 不直接操作網絡安全系統直接把威脅給處置了呢?
潘劍鋒覺得,這里的主要原因不是 AI 的思維還不如人類準確,而是 AI 不具備像人一樣承擔責任的能力。
可能很多淺友看到這里會撇嘴:不就是說還得讓鐵柱來背鍋嘛!
在我看來,它的本質不是背鍋,而是人類試圖在“人機協同”的未來世界里,尋找自己的地位。
我們不妨回到那個金融企業遭受網絡攻擊的現場。問一個“白癡”的問題:為什么企業的安全人員發現了這場攻擊之后,要進行阻止呢?
這是因為安全人員有他的立場!
如果他是被境外組織策反的“內鬼”,他當然不會阻止這次攻擊,還會試圖掩蓋攻擊的痕跡呢。
上帝并不關心所謂的“正義”。A 集體攻擊 B 集體,并不能證明 A 錯 B 對,反之也不能證明 A 對 B 錯。之所以我們堅信某些東西是“正義的”,恰恰因為我們有立場。
而立場的產生,源自共同的“歷史”。
我們中國人相信自己的價值觀,是因為我們了解我們的歷史;人類相信人類的價值觀,也是因為了解人類共同的歷史。
從這個意義上說,正因為我們有特定的歷史,才會有特定的立場,正是因為有立場,才會設定具體目標,而目標是否實現的最終責任,當然要由設定目標的人來承擔。
由此可見,“責任”是一種對自我存在的世界線的保護。
在可預見的未來,無論智能體多么發達,鐵柱一定會盡力把最終改造世界的按鈕連同責任一起握在自己手里。
這才是鐵柱不同于“帕魯”的地方。
這才是鐵柱的意義。
![]()
告別潘劍鋒,我突然想起我們認識大概有七八年了,每次跟他聊天讓我印象最深刻的都是他的極端低調務實。
潘劍鋒是中國最早一代黑客的佼佼者,早在 20 年前他開發的冰刃就是探查系統中木馬后門的利器。可以衣食無憂獨善其身的他還是選擇加入了 360,成為網絡安全戰線上的斗士。
在云計算突飛猛進的年代,他帶著同學們殺盡了技術難度最高的虛擬化安全戰場,做出一套國際領先的基礎設施。如今大模型智能體方興未艾,他又帶著同學們用最新的 AI 技術做出一整套安全運營的體系。
我想強調的并非潘劍鋒的個人履歷,而是想說,在 360 有很多像潘劍鋒一樣的老師傅。他們就是現實世界的“大聰”。
世界上不能沒有千萬鐵柱,但也必少不了大聰。
大聰并非一定要手把手幫助鐵柱。
造出一個“網絡安全智能體”,加持千萬個鐵柱,讓他們不會成為被生活驅逐的“帕魯”,也許是一種更繾綣的善意。
最近經濟并不如從前火熱,網絡安全的市場尤其經歷低谷。
但是,黑暗中的對手卻沒有因此而把攻擊減弱半分。
此時,無數老師傅仍然在埋頭苦干,用最先進的人工智能和智能體來武裝前線的士兵。這種充沛的動力需要一個解釋。
我愿意相信,他們明白有些高地只有自己沖鋒才有勝算,有些歲月只有他們親自守衛才能放心。
這是他們的責任。
![]()
![]()
授人以漁
不如授人以“捕智能體“
再自我介紹一下吧。我叫史中,是一個傾心故事的科技記者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦對了,如果喜歡文章,請別吝惜你的“在看”或“分享”。讓有趣的靈魂有機會相遇,會是一件很美好的事情。
Thx with in Beijing
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.