作者 | 葛覃
編輯 | 阿文
2024年,大模型從理論研究的殿堂,邁向廣闊的現(xiàn)實世界,AI技術(shù)的落地正掀起一場影響深遠的變革浪潮。
9月19日,華為AI用戶峰會在滬舉辦,眾多大咖嘉賓聚而論道,圍繞大模型如何與行業(yè)深度融合,關(guān)于技術(shù)和非技術(shù)的實踐難題,企業(yè)的共性需求和個性要求如何滿足等議題,探討大模型落地的解決之道。
去年海內(nèi)外巨頭與獨角獸不斷刷屏,爭相推出自家大模型的“史詩級更新”,大模型也被寄予厚望,仿佛任何業(yè)務(wù)領(lǐng)域和應(yīng)用場景都能摻上兩腳,F(xiàn)OMO(“Fear of Missing Out”)的情緒從大模型廠商,傳遞到每一家有想法和資源的企業(yè)身上,狂熱與不理智達到了頂峰。
今年“大模型泡沫論”甚囂塵上,以高盛6月份發(fā)布的《生成式AI:投入過多,收益過少?》報告為例,其中提到,未來幾年科技巨頭、企業(yè)和公共部門將在生成式AI上投入約一萬億美元的資金,但目前來看,這些投資似乎并沒有帶來預(yù)期的回報。
期間的反差來自于一個目前無法證實的擔(dān)憂——AI會不會陷入新的低谷?
當然這種擔(dān)憂并不多余。自從1956年的達特茅斯會議之后,人工智能技術(shù)和產(chǎn)業(yè)經(jīng)歷了三起三落,少有一類技術(shù)能夠跨越如此之長的周期,既不歸于沉寂也尚未實現(xiàn)規(guī)模爆發(fā)。
曼哈頓研究所高級研究Mark P. Mills認為,正如汽車、無線電、互聯(lián)網(wǎng)等革命性技術(shù),新技術(shù)在改變世界之前,都會經(jīng)歷漫長的蟄伏期,繞不過發(fā)明創(chuàng)造、商業(yè)可行、大規(guī)模推向市場三個階段。
“顛覆性創(chuàng)新”通常每個階段持續(xù)20年左右。例如在汽車發(fā)明(1886年)之后多年,T 型車設(shè)計才出現(xiàn)(1908 年),到了1920年代末,美國汽車滲透率上升到20%。
有時創(chuàng)新發(fā)生得也會快一點,從“分組交換”的想法到創(chuàng)建互聯(lián)網(wǎng)不到十年,萬維網(wǎng)公開商業(yè)化花了 20 年時間,但只用了 10 年時間就看到了顯著的市場滲透。
AI技術(shù)為時代創(chuàng)造了一個極限彎道賽段,彎道超車還是被狠狠甩下,甚至跌落崖底……一切都是未知,在探索未知的過程中,隱藏在背后的迷霧和暗礁若隱若現(xiàn)。僅就目前來看,企業(yè)落地大模型的共性難題,包括場景、數(shù)據(jù)、成本、IT架構(gòu)、實踐等方面,相互交織又相互聯(lián)系。
場景之困境:如何找到大模型落地場景
人工智能和機器學(xué)習(xí)領(lǐng)域的知名學(xué)者吳恩達認為,大模型在眾多場景中具有巨大的潛力,但也需要與領(lǐng)域知識相結(jié)合。
目前學(xué)術(shù)界與產(chǎn)業(yè)界已經(jīng)達成共識,大模型不是“萬能藥”,只有把大模型任置于具體的場景中,才能兌現(xiàn)技術(shù)價值,避免陷入“拿著錘子找釘子”的窠臼。
此前大模型廠商“內(nèi)卷”參數(shù)和數(shù)量,千億參數(shù)、萬億參數(shù)的大模型,代表了大模型廠商的硬實力,但在很多業(yè)務(wù)場景中,百億級別參數(shù)大模型已經(jīng)足夠,十億級參數(shù)大模型也應(yīng)用頗多。
如果說以前企業(yè)更多看到了炫目的大模型,那么現(xiàn)在更關(guān)注的是,如何將已有的模型應(yīng)用到實際場景中,解決自己的具體問題,并且持續(xù)評估某個具體場景的前景。如此,企業(yè)也從前期探索大模型時的試驗性質(zhì),轉(zhuǎn)而關(guān)注實實在在的指標,可以是降本、增效、以及新體驗。
識別大模型落地場景大致可以分為三大方向,商業(yè)價值決定了是否值得做,場景成熟度決定是否能做,持續(xù)運營空間決定了是否可進化。
數(shù)據(jù)之難題:如何為大模型做好數(shù)據(jù)治理
大模型有多依賴數(shù)據(jù)?中國科學(xué)院院士梅宏一言以蔽之:現(xiàn)階段AI的成功源于深度學(xué)習(xí),這只是AI研究的一個子領(lǐng)域,其本質(zhì)是數(shù)據(jù)驅(qū)動的智能、計算實現(xiàn)的智能,即“數(shù)據(jù)為體、智能為用”,猶如燃料與火焰的關(guān)系,燃料越多,火焰越大,燃料越純,火焰越漂亮。
在深度學(xué)習(xí)算法沒有出現(xiàn)原理變革的前提下,大模型對數(shù)據(jù)的依賴越來越嚴重,對算力的消耗也越來越巨大。在這種情況下,數(shù)據(jù)規(guī)模和質(zhì)量就成為影響大模型落地的關(guān)鍵因素。
值得一提的是,大模型需要的數(shù)據(jù),是全場景、全流程、全方位的知識數(shù)據(jù)。對于企業(yè)而言,企業(yè)原有數(shù)據(jù)庫和大數(shù)據(jù)平臺中的數(shù)據(jù),并不能直接為大模型使用,需要將數(shù)據(jù)加工為大模型能使用的知識?,F(xiàn)實是企業(yè)往往不具備相應(yīng)的數(shù)據(jù)治理能力,部分企業(yè)積累了數(shù)據(jù)卻沒做面向AI的數(shù)據(jù)治理,部分企業(yè)只是簡單儲存了數(shù)據(jù),還有更多的企業(yè)缺少足夠的數(shù)據(jù)。
企業(yè)數(shù)據(jù)可能存在缺失值、噪聲數(shù)據(jù)、重復(fù)數(shù)據(jù)等質(zhì)量問題,需要進行數(shù)據(jù)清洗。數(shù)據(jù)加工也是常見的需求,這可能涉及到數(shù)據(jù)的轉(zhuǎn)換、編碼、特征提取等操作。例如將文本數(shù)據(jù)轉(zhuǎn)換為向量表示,以便大模型能夠進行處理和學(xué)習(xí)。
成本之考量:如何在有限成本下探索大模型
成本,貫穿大模型從研發(fā)到落地再到持續(xù)運營的全過程,早期的算力供給就是一個典型問題,大模型的訓(xùn)練和推理需要大量的算力支持,這就意味著企業(yè)需要投入巨額資金來建設(shè)和維護強大的算力基礎(chǔ)設(shè)施。
構(gòu)建一個大型語言模型可能需要耗費數(shù)百萬美元甚至更多的資金用于購買高性能的 GPU 和 NPU 等計算芯片,以及支付高昂的電力費用和數(shù)據(jù)中心運營成本。即便企業(yè)采取云服務(wù)的方式,也需要考量成本。數(shù)據(jù)的收集、清洗和標注也需要投入大量的時間和金錢,構(gòu)建一個高質(zhì)量的數(shù)據(jù)集可能需要數(shù)千小時的人工工作。
企業(yè)應(yīng)用大模型不僅需要評估啟動成本,更要考慮運營成本。研究公司 Gartner 表示,將 AI 直接部署到公司的系統(tǒng)中,成本可在 500 萬至 2000 萬美元之間,預(yù)計到 2025 年底,30% 的生成式 AI 項目將因為這些高昂的費用而被放棄。
IT之變革:什么樣的企業(yè)IT架構(gòu)才能更好支撐AI
智能化的基礎(chǔ)是數(shù)字化,業(yè)務(wù)數(shù)字化的程度,決定了 AI 能不能落地。以往信息化、數(shù)字化做得好的企業(yè),在探索大模型時更得心應(yīng)手。而企業(yè)越是探索大模型,就越發(fā)現(xiàn)需要補足其他數(shù)字化能力,進而倒逼自己新一輪的 IT 變革。
以數(shù)據(jù)為例,數(shù)據(jù)治理和數(shù)據(jù)能力建設(shè),往往代表企業(yè)有良好的數(shù)字化能力,企業(yè)內(nèi)部有沒有統(tǒng)一的數(shù)據(jù)標準,有咩有明確數(shù)據(jù)的主權(quán)和責(zé)任人,有沒有區(qū)隔不同的數(shù)據(jù)空間。諸如此類的數(shù)字化能力,都是支撐企業(yè)探索大模型的必經(jīng)之路。
如果一個場景連信息化都沒有做到,不可能期盼大模型一下子將其智能化,而這也往往代表該場景有難以克服的問題,不適合被數(shù)字化和智能化。
在一個具體大模型應(yīng)用中,大模型可能只占據(jù)30%的比重,而剩下的70%都依賴于原有的IT和業(yè)務(wù),如果沒有數(shù)字化的業(yè)務(wù)能力,那就意味著大模型只落地了一個“大腦”,缺少“四肢”和“五感”,AI 運營的成本也會大大增加。
因此,大模型一定要與企業(yè)的流程、組織、技術(shù)相結(jié)合,同時企業(yè)的數(shù)據(jù)也要與業(yè)務(wù)場景做深度結(jié)合,才能將人工智能融入企業(yè),真正把人工智能變成一個企業(yè)可用、能為企業(yè)帶來價值增長的工具。
路徑之探索:企業(yè)如何尋找大模型落地最佳實踐
大模型的落地是一場系統(tǒng)性變革,不僅涉及到技術(shù),也需要流程、組織和認知等相應(yīng)的能力支撐,場景、數(shù)據(jù)、IT等,都是大模型落地的突出問題,而如何將這些關(guān)鍵動作梳理清晰,形成一套可執(zhí)行的連貫動作,企業(yè)都在期盼這樣的“最佳實踐”。
行業(yè)內(nèi)常說,數(shù)字化是一把手工程,實際上大模型也是,它不僅能夠確保項目的戰(zhàn)略一致性和資源的有效配置,還能夠提高決策效率,促進跨部門協(xié)作,控制風(fēng)險,并塑造積極的企業(yè)文化。
進入到具體的實操階段后,企業(yè)需要識別業(yè)務(wù)痛點,明確業(yè)務(wù)目標,并通過現(xiàn)狀診斷、能力建設(shè)、應(yīng)用部署和運營管理等步驟,逐步推進大模型的應(yīng)用。這包括了對數(shù)據(jù)的治理、模型的訓(xùn)練、服務(wù)的融入以及持續(xù)運營的規(guī)劃和配套。
此外,大模型的落地還需要考慮數(shù)據(jù)安全和隱私保護的問題,安全合規(guī)始終是企業(yè)開展業(yè)務(wù)的前提。企業(yè)在確保數(shù)據(jù)安全和合規(guī)性的同時,還需要建立相應(yīng)機制,遵守各個國家和地區(qū)的法律法規(guī),避免大模型“水土不服”。
在推動大模型落地的過程中,企業(yè)還需要關(guān)注人才培養(yǎng)和組織變革,例如沿著大模型的邊界構(gòu)建跨部門協(xié)作機制,以便更好地利用大模型技術(shù)進行數(shù)據(jù)分析和決策支持。同時建立一個能夠快速響應(yīng)市場變化和客戶需求,減少層級和冗余的敏捷組織結(jié)構(gòu),對于早期的大模型探索,速度決定生死。
大模型的誕生,來自于非共識。OpenAI信奉“大力出奇跡”工程化的方式,將數(shù)據(jù)、算法、算力等要素資源再融合創(chuàng)造,才有了AI時代新的開端。
而大模型要實現(xiàn)規(guī)模落地,仰仗于形成新共識。當所有企業(yè)都在尋找新時代的取勝之匙,大模型落地才有業(yè)務(wù)價值。
是時候拿著新地圖去開啟AI大航海時代了。