淺友們好~我是史中,我的日常生活是開撩五湖四海的科技大牛,我會嘗試用各種姿勢,把他們的無邊腦洞和溫情故事講給你聽。如果你想和我做朋友,不妨加微信(shizhongmax)。 360想拯救與黑客作戰(zhàn)的100000個“帕魯”多年后的一天,當鐵柱低頭被領導訓斥的時候,也許會想起和大聰結伴回家的那個夜晚。鐵柱來自一座北方十八線小城,畢業(yè)于名不見經傳的二本學校。當初填報志愿兩眼一抹黑,二叔說搞計算機有前途,于是稀里糊涂地選了網絡安全專業(yè),進入一家企業(yè)成為“安全工程師”。第一天坐在工位前,他感覺自己是個飛行員,眼前懟滿了各個安全系統(tǒng)的告警日志。帶他的師傅說:“你的任務很簡單,就是每天找出最危險的 100 條告警,然后順藤摸瓜,看看背后有沒有黑客在搞我們!”鐵柱興奮了,像福爾摩斯一樣拿著放大鏡研究各種告警。但一周后他發(fā)現(xiàn),大部分告警其實是誤報;另外一些告警看上去很可疑,但查了半天也沒搞清楚端倪,只好放在那兒;自己真正能搞懂并且能處理的威脅線索少之又少。。。這哥們名校畢業(yè),對網絡安全的理解很深刻,說話又好聽。鐵柱每天圍著大聰詢問各種安全系統(tǒng)的使用方法,大聰也不吝賜教。可是鐵柱很快發(fā)現(xiàn),他跟不上大聰漂移過彎的思路。。。大聰一會兒就能搞定的事兒,他要搞到很晚才勉強弄完。那天兩人加班到夜里,結伴回家,鐵柱看到萬家燈火,心里一種說不出的滋味。又過了幾個月,大聰辭職了。聽說被一家專門做網絡安全的公司給挖走了。那一刻鐵柱也想走,可冷靜想想自己的能力,還是留下了。日子一天天過,鐵柱當上了小組長,但肩上的擔子越來越重。他所在的企業(yè)數字化改造加快,越來越多關鍵數據都存在網絡空間里;國家《網絡安全法》《個人信息保護法》依次實施,數據一旦失竊,后果重大;偏偏國際形勢、經濟形勢都變得越來越嚴峻,黑客攻擊事件越來越多。 幾年前有些告警不處理也就過去了,但現(xiàn)在。。。天知道哪條告警背后就藏著國際大黑客,手一哆嗦沒準就是幾十億上下的損失。。。企業(yè)于是開始組織內部的“網絡安全演習”,找來“攻擊隊”測試鐵柱團隊的守衛(wèi)效果。鐵柱團隊都是中規(guī)中矩的安全工程師,沒有什么大神,他們只好輪流“守夜”,結果不知道啥時候,還是被攻了進來,底褲都被攻擊隊偷了去。領導興師問罪,鐵柱本想反駁兩句,想想房貸車貸奶粉錢,低頭不敢吭聲。故事先停在這里。我們不妨跳出來,站在岸邊看一下歷史的潮起潮落。歷史上每一場新技術革命后,都會產生很長時間的“排異反應”——由于新技術、新工具本身還不夠成熟,學習、使用它們的腦力成本很高,產業(yè)中的大部分普通人是沒辦法適應的。此刻不僅在網絡安全領域,在各行各業(yè)都有無數“鐵柱們”在掙扎。他們無意偷懶,他們也想成為更好的自己,只因為他們是普通人,能力有限。在變幻莫測的科技浪潮里大口嗆水,漫無目的地“卷來卷去”。毫不夸張地說,“鐵柱”原本就占據了人口的 80% 以上;而環(huán)境還在迅速變化,那 20% 原本不是鐵柱的人也正在變成“鐵柱”。。。可是,正如黃燈在《我的二本學生》中所說:“他們是和腳下打的黏附最緊的生命,是最能傾聽到祖國大地呼吸的年輕群體···他們實現(xiàn)人生愿望的可能性,是中國最基本的底色,也是決定中國命運的關鍵?!?/span>雖然事關國家的安危,但現(xiàn)實是:像“大聰”那樣高端的網絡安全人才極度稀缺,守衛(wèi)安全的中堅力量只能是無數的“鐵柱”們。現(xiàn)在中國的網絡安全從業(yè)者大概有10萬人,其中相當一部分在做最基本的網絡安全運營工作。網絡安全運營工程師的“腦力極限”就像一個泡泡,禁錮著自身的可能性,也禁錮著這個國家的“安全紅線”——怎么穿破普通人“腦力極限”的泡泡,事關興亡,茲事體大。老淺友都知道,我一直熱切地相信,人工智能,就是能刺破我們頭腦泡泡的“白衣騎士”。人工智能“大模型”問世以后,我更加堅定了這個信念。真正能創(chuàng)造出一套接地氣的框架,一邊連接 AI 和具體的工具,一邊連接鐵柱——讓“鐵柱”不用復雜的學習就能被 AI 加持,輕松地升級成“鐵柱 AI Plus”,這才是在推!動!歷!史!中間的路正如迷霧覆蓋的游戲地圖,無數技術人不知要用血肉之軀突圍多少次才能走出來。坐在我面前的潘劍鋒,就是這么一個正在艱苦突圍的人。當然他并不孤單,他背后是 360 公司,以及 360 數字安全團隊的幾百位技術小伙伴們。“你們究竟怎么用 AI 幫助各大企業(yè)的網絡安全工程師呢?”我一上來就直接靈魂拷問。潘劍鋒想了想,覺得要回答這個問題,還是要從頭闡述一下 360 思考這個問題的底層哲學。漢尼拔從來沒吃過中餐,他通過谷歌搜索了一下“魚香肉絲”,這時他就明白了魚香肉絲是個啥樣,這就是獲取信息。但他還沒吃過魚香肉絲,決定自己做一下這道菜,于是去問 ChatGPT,魚香肉絲怎么做?ChatGPT 告訴了他詳細做法步驟,這就是知識。因為 ChatGPT 提到了生詞,例如要用到“泡紅辣椒”、“水淀粉”;還提到了陌生的動作,例如“鍋中放少許油”、“爆炒”,這些背后都隱含了很多細節(jié)信息和實踐經驗,超出了他在“中餐領域”的能力和認知邊界。漢尼拔沒有炒菜的技能,在魚香肉絲面前,他就是鐵柱!咋辦?簡單啊,去中餐館,點一盤魚香肉絲,讓大廚發(fā)揮技能直接給他做就行了。你看到了嗎?最后幫助這個老外的,不是信息,也不是信息編織成的知識,而是知識編織成的“技能”。說回來,剛才潘劍鋒提到了一個關鍵詞——“智能體”。簡單來說,掌握某種“技能”,并且能用這種技能幫助人類完成(與智能相關的)“特定任務”的那個存在,就叫“智能體”,它的英文叫“Agent”。不過在“魚香肉絲”這個例子里,“炒菜”是個物理技能,得有手有眼才能干,想讓智能體掌握這種技能,得先造出一個有手有眼的機器人。這以目前人類的技術水平還比較困難,只能讓“碳基智能體”——人類大廚——代勞。但在很多 IT 領域,比如“網絡安全”,所有的攻防戰(zhàn)斗其實都發(fā)生在虛擬世界,不涉及和物理世界的互動。所以只要能針對某個威脅做出應對策略,并且調用虛擬世界的工具一步步踐行這個策略,它就是一個優(yōu)秀的“網絡安全智能體”!這樣的“網絡安全智能體”,足夠幫助鐵柱做好網絡安全的運營工作,讓他變成“鐵柱 Plus”!說到這,可能有的淺友還有點懵:去年出來的“大模型”我還沒搞明白,又來了個“智能體”,他倆到底是啥關系?如果說大模型是一個發(fā)動機,智能體就是一輛整車。 對于大部分普通人來說,給你個發(fā)動機,你當然知道這玩意兒非常精密,代表人類文明最高水平,但它對你來說就是沒用。。。(這就是為啥 2023 年大模型炒得那么熱鬧,但是普通人卻感覺和自己沒啥關系。。。)但是,給你一輛包含發(fā)動機的整車,你馬上就知道它有用。你可以用它實現(xiàn)特定目的,比如上班、旅游。所以說,工程師們究竟能把“智能體”做到啥程度,才真正決定了這一輪人工智能大模型的爆發(fā)能在多大程度上改變全世界 80 億人的生活。那,現(xiàn)在的“智能體”技術足夠支棱嗎?!話說,人類對于智能體的想象,基本都來自于科幻小說。科幻小說里那種“機器人”,就是智能體的高級形態(tài)。你讓它唱歌跳舞也行,讓它炒菜做飯也行,甚至它不爽了還能反叛呢。。。這種科幻想象,默認了智能體具有執(zhí)行“通用任務”的能力。但是說實話,以目前 2024 年的人類技術水平,還遠遠做不到科幻小說里的“通用”,只能專門為特定的任務調教一些智能體,比如“幫我收集新聞的智能體”、“幫我安排日程的智能體”。。。幫助網絡安全工程師做安全運營工作的智能體,能不能被做出來呢? 網絡安全運營,這個工作聽上去挺聚焦,但其實相當寬泛。因為網絡對抗本來就很像打仗,兵者詭道也,你不知道對面的黑客會使出什么招數。對方出倆王四個二,你得打七對十三幺。。。所以,“網絡安全智能體”反而是所有智能體里非常難的一種。故事還得說到 2023 年 6 月,當時 ChatGPT-4 正在風口,360 也訓練了自己的大模型,也就是“360 智腦”。與此同時,國內外也有一些重磅的大模型陸續(xù)開源,比如 Meta 的 Llama。但實話說,無論是領先的 ChatGPT 還是一眾跟隨者,大家的模型水平都是一言難盡——直說吧,很弱雞。“你說中國的大模型弱我同意,但 ChatGPT-4 我用過,回答問題井井有條,你怎么能說它弱呢?”這是因為,很多人詢問 ChatGPT 的問題是“單步問題”。比如“康德的主要思想是什么?”或者“幫我寫一首有關春天的詩。”大模型只要針對這個問題冥思苦想就夠啦!這種情況 ChatGPT 可以做得不錯↓↓↓但是,現(xiàn)實生活中對我們生活質量產生重大影響的幾乎都是“多步問題”。比如“我喜歡一個女生,她叫李逵,我要干什么才能追到她?”我不相信你只做一件事兒就能追到李逵,你得精心策劃一套劇本:起碼得有“偶遇鐵?!薄ⅰ罢宫F(xiàn)倒拔垂楊柳的能力”、“送她兩壇好酒”、“陪她劫法場”、“表白”等等很多章節(jié),每個章節(jié)里面還得有幾個小標題。。。一套組合拳下來,才有可能追到李逵。如果拿這種多點問題去問 ChatGPT,你得到的一定是一個很籠統(tǒng)的答案,什么“積極交流”呀,什么“提升自己”呀,沒有可操作性。比如你從一條告警開始,要先找到導致告警的黑客動作,再探尋黑客在這個動作之前還做了哪些動作,甚至要找到黑客利用了哪些漏洞,還要溯源黑客的來頭,分析他的目的,寫成完整的報告,同時拔掉黑客在網絡里埋下的釘子,徹底把他攆出去。你跟大模型籠統(tǒng)地問:現(xiàn)在我看到了一條告警,我想攆走黑客,應該怎么辦?哪怕是地表最強的 ChatGPT-4 也根本答不上來。剛才說過,大模型是發(fā)動機,智能體是車,那么智能體框架,就是“除了發(fā)動機以外的汽車框架”。發(fā)動機功率不好的時候,通過提高傳動效率,設計精巧的結構,還是能造出一臺車的!這樣一來,等到發(fā)動機自身升級了,直接替換掉舊發(fā)動機,整車性能不就瞬間爆棚了嗎?! 懷揣這種現(xiàn)實主義的思路,2023 年初夏,潘劍鋒和一眾老師傅上路了。要說清這個“智能體框架”,咱們得想象一個畫面:思維鏈。既然大模型在“解決單點問題”上能力還行,在“總體任務規(guī)劃”上比較弱。那我們能不能把事情拆開?就讓大模型解決一個個單點問題,而把任務規(guī)劃交給另一個模塊來做?這樣,解決一個網絡安全問題的框架就變成了下面這樣:每個小問題都解決了,思維鏈也就推導到了最后一步,總任務完成!“思維鏈”上的每個步驟的“問題”并不相同:有的步驟是大模型純靠思考就能解決的,很多關鍵步驟是大模型必須調用安全工具才能解決的。咱們就拿上圖來說,那條思維鏈上的第 3 步,是要通過“360 威脅情報系統(tǒng)”這個工具來查詢某個 IP 地址有沒有犯罪前科。1)知道“360 威脅情報系統(tǒng)”是干啥的;2)知道用什么命令,才能從“ 360 威脅情報系統(tǒng)”里把數據給查出來。 一個是“現(xiàn)學現(xiàn)賣”,一個是“提前培訓”。所謂“現(xiàn)學現(xiàn)賣”,就是思維鏈已經推進到這一步了,現(xiàn)場告訴大模型有“威脅情報系統(tǒng)”可以用,并且把使用說明書給大模型看,讓它一邊看著操作說明一邊查詢。拿到結果,交給思維鏈的下一步。這波任務結束,它就可以把工具的使用方法給忘了。所謂“提前培訓”,就是提前給大模型上課,把 360 各種安全系統(tǒng)的操作指南都給大模型預先學習,這就是“模型精調”。把精調過的模型放在思維鏈上,它就已經掌握了對很多系統(tǒng)的操作技巧。此時,直接告訴它應該查詢“威脅情報”,它就會查到結果,交給下一步。這次任務結束,它仍然記得這些工具的使用方法。按理說,“現(xiàn)學現(xiàn)賣”和“提前培訓”都可以,而且“現(xiàn)學現(xiàn)賣”反而更簡單。但這里有個巨大的問題,那就是大模型的“輸入窗口”有局限。簡單來說就是,你一次給大模型輸入的信息不能太多,按照 2023 年夏天的技術發(fā)展水平,雖然不同模型有所差異,但基本都在 1k-8k Token,你可以理解為,一次只能給大模型說“8000 個詞”。這就造成了,如果“現(xiàn)學現(xiàn)賣”,思維鏈上的每一步都只能執(zhí)行簡單的操作。因為稍微復雜一點兒,你光教大模型用工具,已經超了 8000 詞,都來不及布置任務了。。。潘劍鋒他們權衡之后,決定用“集中培訓”的方法。(后來的事實證明,他和大部分友商走了不同的路線。)但老師傅們越培訓越發(fā)現(xiàn),難度比想象中要高,這主要是因為大模型有個內生“Bug”——災難性遺忘。也就是說,你給它學越多專業(yè)知識,它就可能遺忘越多通識;你給它學越多 A 方向的專業(yè)知識,它就可能忘記 B 方向的專業(yè)知識。(其實人也有這個毛病,比如很多數學家在生活上都比較低能,比如很多大文豪卻數學不及格。。。)只有一種方法可以減輕“災難性遺忘”,那就是教大模型的“老師”和“教材”要非常厲害。所謂厲害,就是把所有網絡安全系統(tǒng)抽象成高度統(tǒng)一的邏輯,表面上大模型學習的是 A、B、C、D、E 五種系統(tǒng)的知識,本質上它學會的都是同一種安全運營的思路。抽象的層次越高,意味著老師要對網絡安全的理解越透徹,當然也就越難。但既然選了這條難的路線,跪著也得走完。況且 360 作為網絡安全界的大佬,要是干砸了,實在丟不起那個人啊!老師傅用幾個月的時間,把他們近二十年來和黑客組織你來我往實打實的對戰(zhàn)經驗和運營秘籍總結成成一套精巧的《九陰真經》,推著大模型的后背,總算把“內力”給傳輸進去了。這時,潘劍鋒和 360 老師傅們終于能擦擦汗——在那張大圖上,“大模型”和“工具”之間的磨合總算是順滑了。潘劍鋒告訴我,到了 2023 年 8 月,360 安全大模型已經學會了幾十款產品中幾百個接口( API)的調用,而且保證每次調用都是準確的。于是,360 在 ISC 大會上順勢發(fā)布了“360 智控系統(tǒng)”。等等?!為啥叫“智控系統(tǒng)”,不叫“安全智能體”呢?!這個名字背后,其實隱藏了智能體的另一個巨大的難點。你有沒有發(fā)現(xiàn),剛才我們只解決了“大模型”和“工具”之間的配合,但是一直沒說“任務規(guī)劃”是如何進行的。其實,在 2023 年 8 月的時候,即便 360 在大模型安全系統(tǒng)上已經很領先了,但是在“任務規(guī)劃”這個層面上,做得依然不夠理想。這個難點的表現(xiàn)是:思維鏈很難做長。一旦規(guī)劃了一條比較長的思維鏈,就有可能出錯。所以,為了保證系統(tǒng)的功能準確,只能把思維鏈限制得較短。如此,這個系統(tǒng)的突出特點就是“自然語言控制”:比如我說讓系統(tǒng)幫我查一下某個威脅情報,大模型就理解了我的意思,然后調用威脅情報系統(tǒng)去查詢;比如我讓系統(tǒng)幫我解析一下這個告警,它就去查詢這個告警背后的關聯(lián)信息,然后用自然語言解釋給我聽。團隊比較實事求是,干脆起了個保守的名字,就叫“智控系統(tǒng)”。但問題來了,潘劍鋒拿著“360 智控系統(tǒng)”去客戶那安利,甲方的領導提出了一個致命的問題:“如果我花了上百萬買了你的這一套包含大模型的系統(tǒng),結果只是方便了一點點,我為什么要投入?”換句話說,如果你的系統(tǒng)以智能控制為最大賣點,那究竟能給我的安全團隊多大的加持呢?我買你的系統(tǒng)“投入-產出”劃算嗎?你看, 這個問題立刻回到了我們在第一章強調的:公司安全運營團隊里有很多“鐵柱”,他們最需要的不是單點對安全系統(tǒng)的智能控制,而是一整套運用安全系統(tǒng)保衛(wèi)網絡的“技能”。想明白這一點,潘劍鋒回到辦公室,他知道團隊只有沉下心來死磕一件事兒,那就是:把思維鏈做長。而且,在增加思維鏈長度的同時,必須保證專業(yè)性和準確性。思維鏈的起點,是事情現(xiàn)在的樣子;思維鏈的終點,是我們的目標。所以,目標是“切近”還是“遠大”,其實就決定了思維鏈的長短。那么我的思維鏈可能就是:找到面前的水杯,抓起水杯,送到嘴邊,喝下去。你看,這個目標就是切近的目標,思維鏈短,也很清晰,容易規(guī)劃。那么我的思維鏈可能就是:好好學習,結交靠譜的朋友,找到好工作,出任總經理,創(chuàng)業(yè)做 CEO,做大做強,賺到 1 個億。你明顯能感覺到,這個目標很遠大,思維鏈很長,并且每一步都還可以分為更具體的思維鏈,這樣的規(guī)劃即便是人都很難做到,何況 AI 乎?一個網絡安全智能體面對的目標一般都比較遠,咋辦嘞?在市面上已有的智能體技術中,這個任務規(guī)劃模塊是由人工智能(大模型)來全權承擔的。但潘劍鋒經過實驗發(fā)現(xiàn),網絡安全的眾多任務規(guī)劃模塊如果純純交給人工智能,很多鏈條是連不上的。所以這個模塊應該是“人類智能”和“人工智能”共同驅動的。1、360 的安全老師傅們坐在一起,研究出針對很多具體目標的“劇本”。這些劇本其實就是預制的思維鏈。一旦用戶提出這些目標,那么就直接走劇本。2、同時模塊里還有一個特制的大模型,專門負責生成沒有預制劇本,也就是“通用任務”的規(guī)劃,但這個大模型也不是憑感覺亂規(guī)劃,它會參考一份《葵花寶典》,也就是 360 老師傅們總結的“黑客技戰(zhàn)術大全”和已發(fā)現(xiàn)的“高級威脅組織”。 你看,無論是走預制劇本還是現(xiàn)場寫劇本,最后之所以能把思維鏈做長做準,都是因為背后都融入了 360 這些年的安全經驗積累。“把 360 的獨門絕技放進去,才讓我們做出的安全智能體有一道很深的護城河!”潘劍鋒說,“當然,也不能說 360 的劇本庫就完全適合每家企業(yè),客戶也可以通過我們準備的“低代碼平臺”,用拖拽的方法設計他們的本地劇本,添加進劇本庫?!?/span>此時安全智能體的表現(xiàn)雖然說的過去,但仍然被一個“看不見的天花板”所阻擋。當時,這個問題是以非常不經意的姿勢出現(xiàn)的:360 的老師傅發(fā)現(xiàn),對于人類來說順手的“安全工具”,智能體用起來并不順手。這導致了另一個更大的問題:安全專家心里那么多牛X的經驗,沒辦法原汁原味地傳授給大模型——傳授的過程中總要打個折扣。仔細思考,問題就更嚴肅了:雖說 AI 是仿照人類大腦研發(fā)的,但畢竟人類和 AI 是兩個物種,大模型在思考的邏輯性上比人有劣勢,卻在思考穩(wěn)定性上比人類有優(yōu)勢。這么說的話,適合人類的安全工具,也許并不適合 AI 智能體,反而應該為智能體開發(fā)一些它們專屬的工具?!在云計算興起初期,人們的第一感覺自然是把原來的軟件系統(tǒng)搬到云計算上;但是云計算成熟的過程中,越來越多工程師意識到,應該為云這種基礎架構開發(fā)專屬的軟件系統(tǒng),才能充分發(fā)揮云的優(yōu)勢。于是,出現(xiàn)了“云原生軟件”。如此觀之,未來的方向很可能是:“大模型原生”的系統(tǒng)。對于 360 數字安全來說,就是“大模型原生的安全運營系統(tǒng)”。所謂大模型原生,用白話說就是:不要讓大模型去適應原有的安全運營體系,而是把安全運營體系的所有模塊都變成能適應大模型的!想清楚這些,潘劍鋒立刻調動團隊的幾百位工程師,調整他們手里的幾十款安全產品的接口,讓大模型更容易控制。有了“大模型原生”這個方向,很多原本覺得天經地義的事情,此時都成了老師傅的“眼中釘”,亟待被改變。在很多劇本里,都涉及到一個具體步驟,那就是“異常行為檢測”——就是說,判斷這個程序正在表現(xiàn)出來的行為,到底是正常的,還是異常的。過去,由安全工程師來完成這個“檢測”,他需要動用自己的經驗,結合一些檢測工具,才能能給出判斷。這個工作算是“單點任務”,理論上可以由大模型自己來完成。可是,大模型相比人腦而言,思路沒那么清晰,如果一味模仿人的做法,效果很難提升。那為什么不用“大模型原生”的思路,揚長避短,用大模型優(yōu)勢的一面來完成這個工作嘞?于是,潘劍鋒他們對執(zhí)行這個步驟的大模型做了深度“魔改”,利用大模型的一些工作特點直接判斷這個行為是正常的還是異常的,效果一下子就突破了瓶頸。(由于這里涉及很多技術獨創(chuàng),潘劍鋒特地囑咐我別說太細致。。。)把一些大模型從結構上進行改造,更能適應特定的任務。
最初,客戶提出了“智控系統(tǒng)”對人的幫助不夠大的問題,于是 360 的老師傅要把思維鏈做長;在把思維鏈做長的過程中,老師傅意識到可以把 360 這些年積累的獨門秘籍都塞進去;在塞獨門秘籍的過程中,老師傅遇到了一些困難,他們發(fā)現(xiàn)要想把人類經驗完全塞進去,需要首先把一整套智能體的框架都改成“大模型原生”的;為了實現(xiàn)“大模型原生”,老師傅把底層的工具進行了全部改造,還把執(zhí)行特定任務的大模型做了改造,相當于把整個系統(tǒng)按照新的范式重構了一個遍! 這條故事脈絡,其實是科技產品創(chuàng)新的標準劇情:2)但單點的技術突破力量有限,很難顛覆現(xiàn)有秩序;3)只有進入“范式的重構”,把新技術按照新范式排列在一起,才能形成合力,在地層上扎牢根系,帶領新世界一騎絕塵。說回我們的故事,所有這些做完,已經到了 2024 年 1 月。潘劍鋒穿著“王子復仇”的華服,殺回到幾家大企業(yè)客戶那里:你們要的“技能”來啦,看看智能體究竟能幫你們的“鐵柱”做多少事情! 系統(tǒng)同時部署在幾家企業(yè)里做測試。究竟能不能抓到黑客,其實潘劍鋒心里也有點打鼓。。。這倒不是對技術沒信心,而是萬一在測試階段沒有黑客進攻,智能體只能做日常巡檢,搞不了“大新聞”啊。也不知是幸運還是不幸,幾天之后,在一家大型金融企業(yè)里,緊張的情節(jié)突然開始上演:這家企業(yè)的財務部同事收到一封郵件,標題顯示,是有關“Paypal 海外支付”的。(當時用戶并沒有截圖,內控制度也不允許截圖,這是后來 360 老師傅根據現(xiàn)場復現(xiàn)的)由于這家企業(yè)有很多海外業(yè)務,收到 Paypal 的郵件再正常不過了,所以這個同事沒有多想就點開了郵件附件。附件是一個 Word 文檔,里面幾乎都是韓文內容。這位同事覺得可能是 Paypal 發(fā)錯了,或者后續(xù)還會有英文版內容發(fā)過來,也沒多想。可是就在幾秒鐘后,部署在網絡中的 360 本地安全大腦彈出了一條告警。 這條告警不僅推送給了企業(yè)安全運營團隊,也同時推送給了時刻待命的 360 安全智能體。360 安全智能體用了十秒左右的時間對任務進行規(guī)劃,然后按照規(guī)劃一步步執(zhí)行:1、它根據告警,找到了導致告警的病毒文件,并且把這個文件里的代碼侵入這臺主機的全過程日志都做了摘錄。2、根據 360 的研判,記錄下了它的全部行為特征:利用模板注入,投放宏病毒,將竊密模塊注冊為系統(tǒng)服務,收集敏感數據,通過網絡傳出。3、用這個行為特征去 360 的威脅情報庫查詢,結果是,它和 360 記錄在案的一個位于朝鮮半島的“高級威脅組織” APT-C-28 的相似度達到了 99%。4、智能體馬上拿著這個高級威脅組織的行動特點,在企業(yè)的內網里開始拉網式搜尋,發(fā)現(xiàn)受感染的主機已經不止最初的那一個,而是擴散到了另外四個,分別是:“cmdb 資產161”、“DNS 服務器”、“GQQ”、“Web 服務器”。這些資產可都是和業(yè)務相關的!5、根據這些結果,用大模型自動書寫一份調查報告,同時生成一份處置建議。6、調查報告和處置建議一起被發(fā)送給安全運營人員,他們做最終研判,可以點擊按照處置建議執(zhí)行,也可以修改或添加其他處置行動。7、至此,對這條告警的“圍獵”結束,智能體回歸待命狀態(tài)。在最后的報告里,“安全智能體”追溯出了黑客完整的攻擊路徑。 這個故事里,讓潘劍鋒覺得驕傲的,不僅是 360 安全智能體正確操作了整個“威脅獵殺”的思維鏈,還有它完成整個操作的過程只有不到 1 分鐘。我們不妨再回到攻擊的開始,就在財務同事點開帶毒文件的一瞬間,其實就像一個發(fā)令槍,安全人員和黑客開始了“奪命賽跑”。每一秒,黑客都在網絡里沖殺,試圖感染更重要的主機,盡可能把重要的信息傳輸出去。這些信息不一定是企業(yè)核心數據,更有可能是某些子系統(tǒng)的登錄密碼,網絡拓撲結構等等。只要黑客拿到了這些信息,哪怕這波攻擊被安全人員發(fā)現(xiàn),殺掉了病毒進程,它依然是成功的——因為黑客可以利用竊取到的密碼和網絡結構信息,擇良辰吉日卷土重來。黑客掌握的信息越多,就越不容易被安全系統(tǒng)發(fā)現(xiàn)。于是,很可能每一次黑客都可以在之前的“成果”上再推進一點點,直到最后拿到核心機密。而安全人員要做的事情,就是趕在黑客拿到某些信息并且把它傳輸出去之前就干掉病毒,并且把病毒構建的對外傳輸通道徹底堵死。這種攻守天平非常不穩(wěn)定,每推遲一秒,都可能向黑客的方向傾斜。這種傾斜,是無可挽回的!由此,我們再回看整個威脅獵殺的過程,只用了不到 60 秒,你就能明白這個事實有多鋒利。如果交給高級安全人員,當然也能分析出和智能體相同的報告,甚至比智能體發(fā)現(xiàn)更多的蛛絲馬跡,報告寫得更準確,但是有一點可以肯定:人類的用時必定超過安全智能體。真正的武林對決中,你的功夫再扎實,如果出拳太慢,還是會敗,正所謂——“天下武功,唯快不破”。由此,智能體終于展現(xiàn)出了“大模型原生范式”的光芒。就在老師傅們?yōu)樽约菏衷斓钠孥E歡呼時,在其他測試企業(yè)里,智能體也發(fā)現(xiàn)了其他的黑客進攻行為。他的意思是,雖然 360 的老師傅們做了很多努力,但是畢竟產品剛剛成熟,還要經歷在客戶運行環(huán)境中的磨合。況且潘劍鋒覺得,安全智能體是一個非常有挑戰(zhàn)的新技術,就在過去幾個月間,團隊克服了很多友商還在苦苦思索的難題,有了一定的優(yōu)勢,但如果潛心努力,優(yōu)勢還能進一步擴大,此時還是低調為妙。如果從天空俯瞰,這一輪人工智能大模型的爆發(fā)會重構千行百業(yè),而重構的具體過程,就是通過千百個“智能體”來實現(xiàn)的。在網絡安全領域,誰拿下了“智能體”的高地,就相當于擁有了降維打擊的能力,這會影響至少未來 10 年的競爭格局,當然要審慎再審慎。如果說 360 數字安全的發(fā)展也有“劇本”的話,那我猜這幫老師傅給自己寫的劇本就是——偷偷努力,然后驚艷世人。潘劍鋒告訴我,如果未來大模型的能力進一步增強,那么規(guī)劃的任務也可以脫離“預制劇本”,更多地交給模型去自動生成。在我看來,這就是規(guī)劃層的“大模型原生”。走到這一步,智能體距離科幻電影就更近了一些。在他看來這是天經地義的,卻猛地撬開了我思考的閘門。一個客戶,可能買了 360 的主機防護系統(tǒng),可能買了 360 的防火墻,也可能買了能匯集所有安全系統(tǒng)信息的“本地安全大腦”。這些系統(tǒng)完全可以完全沒有“智能體”介入,由安全運營人員去操作;智能體也可以獨立操作“主機防護系統(tǒng)”、“威脅情報系統(tǒng)”、“本地安全大腦”; 這個事情的奇妙之處在于:我們都知道“智能體”本來是一行行的代碼,和那些同樣由一行行代碼組成的工具更為類似。但在生態(tài)位上,智能體卻和人的地位更相近。正是這種生態(tài)位的相近,讓智能體可以和人融合,把鐵柱變成“鐵柱 Plus”。看到這里,很多人會有警覺:鐵柱 Plus 繼續(xù)發(fā)展,會不會有一天鐵柱沒了,只剩下“Plus”?其實,從 360 的智能體里,我們已經可以看到一些端倪:潘劍鋒他們把智能體的思維鏈做了個限制,最遠只到:給出操作建議。為什么 AI 不直接操作網絡安全系統(tǒng)直接把威脅給處置了呢?潘劍鋒覺得,這里的主要原因不是 AI 的思維還不如人類準確,而是 AI 不具備像人一樣承擔責任的能力。可能很多淺友看到這里會撇嘴:不就是說還得讓鐵柱來背鍋嘛!在我看來,它的本質不是背鍋,而是人類試圖在“人機協(xié)同”的未來世界里,尋找自己的地位。我們不妨回到那個金融企業(yè)遭受網絡攻擊的現(xiàn)場。問一個“白癡”的問題:為什么企業(yè)的安全人員發(fā)現(xiàn)了這場攻擊之后,要進行阻止呢?如果他是被境外組織策反的“內鬼”,他當然不會阻止這次攻擊,還會試圖掩蓋攻擊的痕跡呢。上帝并不關心所謂的“正義”。A 集體攻擊 B 集體,并不能證明 A 錯 B 對,反之也不能證明 A 對 B 錯。之所以我們堅信某些東西是“正義的”,恰恰因為我們有立場。我們中國人相信自己的價值觀,是因為我們了解我們的歷史;人類相信人類的價值觀,也是因為了解人類共同的歷史。從這個意義上說,正因為我們有特定的歷史,才會有特定的立場,正是因為有立場,才會設定具體目標,而目標是否實現(xiàn)的最終責任,當然要由設定目標的人來承擔。由此可見,“責任”是一種對自我存在的世界線的保護。在可預見的未來,無論智能體多么發(fā)達,鐵柱一定會盡力把最終改造世界的按鈕連同責任一起握在自己手里。告別潘劍鋒,我突然想起我們認識大概有七八年了,每次跟他聊天讓我印象最深刻的都是他的極端低調務實。潘劍鋒是中國最早一代黑客的佼佼者,早在 20 年前他開發(fā)的冰刃就是探查系統(tǒng)中木馬后門的利器。可以衣食無憂獨善其身的他還是選擇加入了 360,成為網絡安全戰(zhàn)線上的斗士。在云計算突飛猛進的年代,他帶著同學們殺盡了技術難度最高的虛擬化安全戰(zhàn)場,做出一套國際領先的基礎設施。如今大模型智能體方興未艾,他又帶著同學們用最新的 AI 技術做出一整套安全運營的體系。我想強調的并非潘劍鋒的個人履歷,而是想說,在 360 有很多像潘劍鋒一樣的老師傅。他們就是現(xiàn)實世界的“大聰”。造出一個“網絡安全智能體”,加持千萬個鐵柱,讓他們不會成為被生活驅逐的“帕魯”,也許是一種更繾綣的善意。最近經濟并不如從前火熱,網絡安全的市場尤其經歷低谷。此時,無數老師傅仍然在埋頭苦干,用最先進的人工智能和智能體來武裝前線的士兵。這種充沛的動力需要一個解釋。我愿意相信,他們明白有些高地只有自己沖鋒才有勝算,有些歲月只有他們親自守衛(wèi)才能放心。
授人以漁
|