近一年來,隨著大模型突飛猛進(jìn)的發(fā)展,基于大模型的推理泛化能力的語言智能體 (Language Agents) 展示了通向 AGI 的巨大潛力??蒲泻烷_發(fā)者社區(qū)也涌現(xiàn)出各種語言智能體的框架和系統(tǒng),如 AutoGPT [1], LangChain [2], SuperAGI [3] 等。這些系統(tǒng)能夠接受人類提供的簡單的指令之后自主規(guī)劃和執(zhí)行任務(wù)。盡管看起來很炫酷,這些框架和系統(tǒng)的都存在一個非常致命的通?。褐悄荏w的運(yùn)行一旦開始,就幾乎脫離了人類的控制,對任務(wù)規(guī)劃和執(zhí)行一旦出錯,就會通過誤差傳播引起明顯的滾雪球效應(yīng),因此任務(wù)失敗概率很高。除了失敗率高以外,更致命的是用戶或開發(fā)者遇到這種情況,對于如何調(diào)優(yōu)很容易完全沒有頭緒,只能盲目更改任務(wù)描述,依靠玄學(xué)希望得到更好的效果。 圖 1 Agents 框架示意圖 為了解決這個痛點(diǎn),讓 LLM Agent 更可控,調(diào)優(yōu) LLM Agent 的過程更簡單更系統(tǒng)化,波形智能聯(lián)合蘇黎世聯(lián)邦理工大學(xué)和浙江大學(xué),開發(fā)了名為 Agents 的開源智能體框架。
Agents 框架探索了通過結(jié)合基于推理圖的符號主義 (symbolism) 推理和基于 LLM 的連接主義 (connectionism) 推理,來結(jié)合高層次的世界模型知識和低層次的簡單推理泛化能力,從而實(shí)現(xiàn)更智能更可控的通用人工智能 (AGI) 方案。 具體來說,該框架創(chuàng)新性地提供了通過符號式的推理圖,即 “SOP”,來對任務(wù)進(jìn)行分解,首次實(shí)現(xiàn)了對 LLM Agent 的細(xì)粒度控制??蚣芡瑫r支持長短期記憶,工具使用,網(wǎng)絡(luò)搜索,以及多智能體系統(tǒng)的構(gòu)建,用戶只需要用自然語言填寫配置文檔,就能輕松定義各種功能和使用場景的 AI 智能體 / 多智能體系統(tǒng),比如導(dǎo)購機(jī)器人,客服機(jī)器人,以及包含各種角色的小說工作室。 在支持零代碼定制 / 微調(diào)多智能體系統(tǒng)的同時,Agents 框架也對開發(fā)者和研究者擴(kuò)展新的功能和定制復(fù)雜的多智能體環(huán)境 / 場景提供了很好的支持,為基于語言的智能體 (Language Agents) 研究提供便利。Agents 框架的主要功能和亮點(diǎn)如下:
圖 2 Agents 框架和其他常見開源智能體系統(tǒng)框架的功能對比 Agents 框架介紹Agents 框架包含三個主要類:Agent、SOP 和 Environment,具體如下:
智能體系統(tǒng)的初始化代碼如下:所有類均可由一個用戶定制好的 config 文件加載。 加載之后多智能系統(tǒng)的運(yùn)行邏輯如下:SOP 的控制器決定了下一個狀態(tài)和行動的智能體是哪個,之后智能體結(jié)合環(huán)境和狀態(tài)執(zhí)行行動,最后環(huán)境根據(jù)智能體的行為進(jìn)行自我更新。Agents 框架同時支持讓智能體系統(tǒng)動態(tài) Planning,生成新的后續(xù)狀態(tài)和節(jié)點(diǎn),只需要定義從 action 抽取新狀態(tài)節(jié)點(diǎn)設(shè)置的函數(shù)并將對應(yīng)的設(shè)置動態(tài)添加到當(dāng)前的 SOP 中即可。 利用 Agents 框架定制多智能體系統(tǒng)的流程Step 1:配置多智能體系統(tǒng)參數(shù) (框架提供了相應(yīng)的 WebUI) Step 2: 得到 JSON 配置文件 Step 3:啟動多智能體系統(tǒng) 基于 Agents 框架搭建的 “影視工作室” 系統(tǒng)接下來,作者展示了一個利用 Agents 框架開發(fā)的多智能體影視工作室的 Demo。小說工作室中包括了作家,編輯,導(dǎo)演,和演員等角色。SOP 中規(guī)定了首先作家和編輯要根據(jù)特定的劇情設(shè)定來構(gòu)思人設(shè)和劇本大綱,之后作家根據(jù)大綱寫出劇本,再由導(dǎo)演根據(jù)劇本指導(dǎo)多個演員一起進(jìn)行每一段情節(jié)的表演: 其他的多智能體框架在接受了這樣一個復(fù)雜流程的指示之后,很容易會在執(zhí)行任務(wù)的過程中逐漸偏離原始的任務(wù)規(guī)劃和指示。這是因?yàn)樵诿恳淮螆?zhí)行的時候,各個智能體都只能根據(jù)總體的相對籠統(tǒng)的任務(wù)介紹來推測系統(tǒng)現(xiàn)在走到了哪一步以及接下來要做什么,而基于 Agents 框架的智能體系統(tǒng)則為每個智能體提供了當(dāng)前狀態(tài)特有的指令,規(guī)則,和示例,并且有了解全局任務(wù)和當(dāng)前 / 下一個狀態(tài)各自的目標(biāo)的控制器來決定狀態(tài)的轉(zhuǎn)變,因此能夠更準(zhǔn)確、穩(wěn)定地沿著預(yù)先設(shè)定的流程完成整個劇本設(shè)計,創(chuàng)作到表演的復(fù)雜任務(wù)流。 Agents 框架除了支持在終端和 Gradio 體驗(yàn)多智能體系統(tǒng)之外,還為開發(fā)者提供了利用 FastAPI 在后端部署自主智能體系統(tǒng)的示例代碼,可以讓開發(fā)者便捷的將調(diào)教好的智能體部署到應(yīng)用程序中。另外 Agents 開發(fā)團(tuán)隊還提供了 community AgentHub,可供方便地供用戶搜索他人共享的智能體系統(tǒng)從而更便捷地打造自己的智能體系統(tǒng),也可以將自己調(diào)試好的智能體系統(tǒng)方便地共享給社區(qū)其他用戶。 |
|
來自: taotao_2016 > 《AI》