****(百度,阿里,智普,科大訊飛 AI Agent)AI Agent調(diào)研--7種Agent框架對比,！大家都在用Agent做什么？

張先民 2024-07-18 發(fā)布于北京

展開全文

AI Agent調(diào)研--7種Agent框架對比,！大家都在用Agent做什么,？

代理（Agent）乃一種智能實(shí)體，具備自主環(huán)境感知與決策行動(dòng)能力,，旨在達(dá)成既定目標(biāo),。作為個(gè)人或組織之?dāng)?shù)字化替身，AI代理執(zhí)行特定任務(wù)與交易,，其核心價(jià)值在于簡化工作流程,，削減繁復(fù)性，并有效降低人力投入與溝通障礙,，促進(jìn)效率與協(xié)作的雙重提升,。簡而言之，代理技術(shù)讓AI成為高效助手,，助力個(gè)人與組織在復(fù)雜多變的環(huán)境中更加游刃有余,。

01 Agent基礎(chǔ)

Agent的核心決策機(jī)制圍繞著動(dòng)態(tài)適應(yīng)與持續(xù)優(yōu)化展開。它使LLM（大型語言模型）能夠依據(jù)實(shí)時(shí)變動(dòng)的環(huán)境信息,，靈活選擇并執(zhí)行恰當(dāng)?shù)男袆?dòng)策略,，或?qū)π袆?dòng)結(jié)果進(jìn)行精準(zhǔn)評估與判斷。這一過程通過多輪迭代不斷重復(fù),，每一次迭代都基于對環(huán)境的深入理解與上一次執(zhí)行效果的反饋,，旨在逐步逼近并最終達(dá)成既定目標(biāo)。Agent的此種運(yùn)作模式,，確保了其在復(fù)雜多變的環(huán)境中能夠保持高效,、靈活與適應(yīng)性,，持續(xù)推動(dòng)任務(wù)向成功邁進(jìn)。

精簡的決策流程：P（感知）→ P（規(guī)劃）→ A（行動(dòng)）

感知（Perception）是指Agent從環(huán)境中收集信息并從中提取相關(guān)知識(shí)的能力,。
規(guī)劃（Planning）是指Agent為了某一目標(biāo)而作出的決策過程,。
行動(dòng)（Action）是指基于環(huán)境和規(guī)劃做出的動(dòng)作。

工程實(shí)現(xiàn)上可以拆分出四大塊核心模塊：推理,、記憶,、工具、行動(dòng)

02 各平臺(tái)功能總結(jié)與比較

官方GPTs商店：各大平臺(tái)均設(shè)有官方GPTs應(yīng)用商店,，匯聚了琳瑯滿目的插件與模型,，滿足多元化需求。

知識(shí)庫：在知識(shí)庫構(gòu)建上,，各平臺(tái)展現(xiàn)獨(dú)特風(fēng)采,，內(nèi)容既廣泛又深入，助力用戶輕松獲取所需信息,。

流程圖編排： 流程圖編排功能作為標(biāo)配,，讓無編程基礎(chǔ)的用戶也能通過直觀拖拽，迅速構(gòu)建高效工作流,，實(shí)現(xiàn)流程自動(dòng)化,。

多模型支持：對于模型支持，部分平臺(tái)展現(xiàn)開放姿態(tài),，兼容多模型選擇,；而有的則專注于自家大模型深度優(yōu)化，但無論哪種,，均能有效支撐日常工作的順利進(jìn)行,。

插件調(diào)用：插件調(diào)用機(jī)制的引入，極大增強(qiáng)了平臺(tái)的靈活性與擴(kuò)展性,，用戶可根據(jù)實(shí)際需求靈活調(diào)用各類插件,，提升工作效率。

Prompt配置：至于Prompt配置,，各平臺(tái)均展現(xiàn)出創(chuàng)新精神,，提供個(gè)性化、精細(xì)化的配置選項(xiàng),，確保用戶能夠精確控制模型行為,，滿足特定場景下的需求。

03 國內(nèi)主流一站式Agent平臺(tái)深度測評

1.Betteryeah

網(wǎng)址：
https://www./agentstore

斑頭雁智能科技,，其核心團(tuán)隊(duì)源自阿里巴巴釘釘?shù)某鮿?chuàng)精英,，專注于打造零門檻Agent構(gòu)建平臺(tái),，旨在迅速激活并釋放大模型的強(qiáng)大潛力。該平臺(tái)內(nèi)置了包括ChatGLM,、阿里通義千問,、百度千帆在內(nèi)的國內(nèi)外頂尖AI模型，為用戶提供了豐富的選擇,。

產(chǎn)品形態(tài)：在產(chǎn)品形態(tài)上,，斑頭雁智能科技與Coze等前沿平臺(tái)并駕齊驅(qū)，均屬于高度集成的平臺(tái)型產(chǎn)品,，為用戶提供了一站式解決方案,。

開發(fā)模式：其開發(fā)模式靈活多變，既支持單一Agent的精細(xì)化打造,，也適應(yīng)于Multi-Agent系統(tǒng)的復(fù)雜部署,，滿足不同業(yè)務(wù)場景下的多樣化需求。

應(yīng)用場景：面向企業(yè)級(jí)市場,，斑頭雁智能科技聚焦AI客服,、營銷、銷售等多個(gè)關(guān)鍵領(lǐng)域,，提供智能化升級(jí)的全面解決方案,。

其官方智能體中心更是匯聚了全類別的智能應(yīng)用，從全面的智能客服系統(tǒng),，到針對電商,、銷售、營銷,、HR等多個(gè)垂直行業(yè)的定制化方案,，再到快速上手的學(xué)習(xí)資源，一應(yīng)俱全,，助力企業(yè)輕松實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型與智能化升級(jí),。

2.Coze

網(wǎng)址：https://www.

Coze,，作為字節(jié)精心打造的AI Bot開發(fā)旗艦平臺(tái)，致力于賦能開發(fā)者,，以強(qiáng)大而簡潔的界面,，加速智能聊天機(jī)器人的設(shè)計(jì)與部署流程。在中文大模型智能體生態(tài)中,，Coze以其先驅(qū)地位傲視群雄,，無論是率先布局的市場先機(jī)，還是其在智能體編排工具的成熟度,、插件的廣泛性,、兼容大模型種類的多樣性,，乃至發(fā)布渠道的全面覆蓋，均展現(xiàn)出非凡實(shí)力,。

Coze平臺(tái)慷慨開放,，無論是其自研的云雀大模型，還是外部知名的moonshot等尖端技術(shù),，均對開發(fā)者免費(fèi)開放,，極大地降低了創(chuàng)新門檻。其卓越的用戶體驗(yàn)與龐大的日活用戶數(shù),，共同構(gòu)筑了行業(yè)內(nèi)的領(lǐng)先地位,，無論是從生態(tài)構(gòu)建、用戶體驗(yàn),，還是底層技術(shù)支撐來看,，Coze無疑是眾多智能體平臺(tái)中的佼佼者。

不得不提的是字節(jié)的另一款A(yù)I智能對話助手——豆包,。豆包以其獨(dú)特的prompt驅(qū)動(dòng)方式，讓用戶能夠輕松定制專屬智能體,，其亮點(diǎn)在于無縫集成了先進(jìn)的TTS（文本到語音）技術(shù),，讓自定義的智能體能夠直接與用戶進(jìn)行語音交互，體驗(yàn)更加自然流暢,。相較于Coze的全方位智能體構(gòu)建方案,，豆包更像是一款功能精煉、操作快捷的便攜式Coze版本,，尤其適合在移動(dòng)端快速高效地應(yīng)用,。以下是豆包智能體中心的精彩展示，進(jìn)一步詮釋了其便捷與高效,。

3.百度千帆AgentBuilder

網(wǎng)址：https://agents.baidu.com/

百度AgentBuilder是一款智能體開發(fā)工具,，旨在降低智能體開發(fā)門檻,，讓每個(gè)人、每個(gè)組織都能夠成為智能體的開發(fā)者,。AgentBuilder是百度推出的三大AI開發(fā)工具之一,，另外兩個(gè)工具分別是AppBuilder和ModelBuilder(小紙條之前的文章給大家介紹過各家產(chǎn)品們的區(qū)別)。

產(chǎn)品形態(tài)：基于文心大模型的智能體平臺(tái),，也是平臺(tái)型,。

開發(fā)方式：支持開發(fā)者根據(jù)自身行業(yè)領(lǐng)域和應(yīng)用場景選擇不同類型的開發(fā)方式，提供低成本的prompt編排方式,。

功能特點(diǎn)：提供零代碼和低代碼兩種開發(fā)模式,，適合不同技術(shù)背景的開發(fā)者

來看下智能體中心大家都在用什么,，熱門的主要也還是聚焦提效、娛樂,、生活,、以及實(shí)時(shí)熱點(diǎn)的高考。

4.SkyAgents(昆侖萬維)

網(wǎng)址：
https://model-platform-skyagents.

昆侖萬維公司隆重推出天工SkyAgents，這是一款引領(lǐng)未來的AI Agents構(gòu)建平臺(tái),，旨在重塑智能應(yīng)用的創(chuàng)造邊界,。

產(chǎn)品形態(tài)創(chuàng)新：天工SkyAgents以其先進(jìn)的技術(shù)架構(gòu)，打造了一個(gè)高效,、靈活的AI Agents構(gòu)建生態(tài)系統(tǒng),。該平臺(tái)不僅集成了前沿的人工智能技術(shù)，還通過模塊化設(shè)計(jì),，讓AI Agent的創(chuàng)建與部署變得前所未有的簡單快捷,。

開發(fā)體驗(yàn)革新：區(qū)別于傳統(tǒng)繁瑣的開發(fā)流程，天工SkyAgents引入了革命性的開發(fā)方式,。用戶僅需通過自然語言輸入,，即可輕松描述AI Agent的功能與行為；同時(shí),，可視化拖拽界面更是將復(fù)雜的技術(shù)操作簡化為直觀的圖形操作,，深度集成Skywork大語言模型，讓AI Agent的智能化水平躍升至新高度,。

應(yīng)用場景廣泛：天工SkyAgents的智能體,，憑借其強(qiáng)大的感知與決策能力，能夠精準(zhǔn)適配各類具體業(yè)務(wù)場景,。無論是電商平臺(tái)的個(gè)性化推薦,、客服系統(tǒng)的智能應(yīng)答，還是金融領(lǐng)域的風(fēng)險(xiǎn)評估,、智能制造的自動(dòng)化控制,，天工SkyAgents都能以用戶需求為核心，提供定制化的智能解決方案,，助力企業(yè)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型與升級(jí),。

社區(qū)生態(tài)活躍：在天工SkyAgents的智能體中心，一個(gè)充滿活力的社區(qū)生態(tài)正在形成,。這里不僅有官方精心打造的示例Agents,，展示著AI Agent的無限可能與最佳實(shí)踐；更有來自全球的個(gè)人開發(fā)者,，他們通過天工平臺(tái)貢獻(xiàn)自己的智慧與創(chuàng)意,，構(gòu)建了一個(gè)豐富多彩,、不斷更新的Agent市場。這個(gè)市場不僅為開發(fā)者提供了展示自我的舞臺(tái),，更為用戶提供了更多元化,、更個(gè)性化的AI服務(wù)選擇。

綜上所述,，天工SkyAgents以其獨(dú)特的產(chǎn)品形態(tài),、革新的開發(fā)方式、廣泛的應(yīng)用場景以及活躍的社區(qū)生態(tài),，正逐步成為AI Agent構(gòu)建領(lǐng)域的佼佼者,。未來，隨著技術(shù)的不斷進(jìn)步與應(yīng)用的持續(xù)深化,，天工SkyAgents有望引領(lǐng)智能體技術(shù)邁向新的高度,，為人類社會(huì)創(chuàng)造更加美好的智能生活。

5.阿里云魔搭社區(qū)

網(wǎng)址：
https:///studios/agent

產(chǎn)品形態(tài)革新：我們自豪地推出這款專為開源大語言模型（LLM）量身定制的AI Agent開發(fā)框架。它不僅完美兼容并優(yōu)化各類主流LLM,，還提供了一個(gè)高度靈活與可擴(kuò)展的平臺(tái),，讓AI Agent的開發(fā)與部署更加便捷高效。

開發(fā)方式多元化：該框架支持創(chuàng)建多樣化的多模態(tài)AI Agent,，涵蓋客戶服務(wù),、個(gè)人助理等多個(gè)領(lǐng)域,，滿足不同場景下的智能化需求,。用戶可以根據(jù)具體業(yè)務(wù)場景，輕松構(gòu)建出既能處理文本對話,，又能理解圖像,、語音等多類型信息的智能體，實(shí)現(xiàn)全方位的用戶交互體驗(yàn),。

一鍵協(xié)作,，簡化流程：我們深知在AI項(xiàng)目開發(fā)中，模型間的協(xié)作至關(guān)重要,。因此,，該框架創(chuàng)新性地引入了一鍵發(fā)送指令調(diào)用其他AI模型的功能，大幅簡化了模型集成與協(xié)作的流程,。用戶無需深入技術(shù)細(xì)節(jié),，即可輕松實(shí)現(xiàn)多模型間的無縫對接，提升整體項(xiàng)目的智能化水平和響應(yīng)速度,。

低/零代碼平臺(tái),，降低門檻：為了進(jìn)一步降低AI Agent的開發(fā)門檻,，我們結(jié)合了低/零代碼平臺(tái)的設(shè)計(jì)理念，讓非技術(shù)背景的用戶也能參與到AI應(yīng)用的開發(fā)中來,。通過直觀的圖形化界面和豐富的預(yù)設(shè)模板,，用戶可以快速上手，實(shí)現(xiàn)個(gè)性化定制的智能體,，無需編寫復(fù)雜的代碼,。

廣泛適用，未來可期：該框架設(shè)計(jì)之初就充分考慮了未來技術(shù)的發(fā)展趨勢,，因此它不僅適用于當(dāng)前多種業(yè)務(wù)場景,，還具備高度的可擴(kuò)展性和兼容性。隨著開源大模型的不斷涌現(xiàn)與更新,，我們將持續(xù)優(yōu)化該框架,，確保它能夠快速適配更多新增的開源大模型，為用戶提供更加豐富和強(qiáng)大的AI解決方案,。

創(chuàng)建智能體新體驗(yàn)：在開源社區(qū)中,，該產(chǎn)品的智能體創(chuàng)建過程同樣令人印象深刻。用戶可以通過對話配置和參數(shù)配置兩種方式,，靈活定義智能體的行為邏輯和外觀樣式,。雖然當(dāng)前版本暫未直接展示workflow流程設(shè)計(jì)界面，但憑借其強(qiáng)大的功能集成和易用性設(shè)計(jì),，我們相信未來版本中將會(huì)引入更多高級(jí)功能,，包括workflow流程編輯器等，以進(jìn)一步提升用戶的開發(fā)體驗(yàn)和智能體的智能化水平,。

6.訊飛的星火友伴

網(wǎng)址：
https://xinghuo./botcenter/createbot

訊飛科技,，以其深厚的AI技術(shù)底蘊(yùn),，攜手星火V3.0這一強(qiáng)大引擎，精心打造了一個(gè)專注于虛擬人格GPTs應(yīng)用的創(chuàng)新平臺(tái),。該平臺(tái)不僅代表了訊飛在人工智能領(lǐng)域的又一里程碑式成果,，更是為探索個(gè)性化智能交互體驗(yàn)開辟了全新的道路。

智能體中心,，是由訊飛官方精心設(shè)計(jì)的虛擬人格模板,。這些模板各具特色，涵蓋了從親切友善的客服助手到風(fēng)趣幽默的聊天伙伴,，再到專業(yè)嚴(yán)謹(jǐn)?shù)念檰枌?dǎo)師等多種角色設(shè)定,。

用戶可根據(jù)自身需求與偏好，輕松選擇一款合適的模板作為起點(diǎn)，也可以通過平臺(tái)的強(qiáng)大功能進(jìn)行二次改造與個(gè)性化定制,。

7.智譜

網(wǎng)址：
https:///main/toolsCenter

智譜清言推出的Agent生成器,，在提供基礎(chǔ)智能體生成能力的同時(shí),，獨(dú)具特色地支持開發(fā)者通過API調(diào)用方式靈活使用智能體。

該API廣泛覆蓋清言C端頁面的核心功能,，包括文本對話,、文生圖、圖片解讀,、聯(lián)網(wǎng)搜索,、文檔解析、Python代碼執(zhí)行及外部API調(diào)用等,。

在智能體中心,，熱門智能體琳瑯滿目，既有官方精心打造的,，也有個(gè)人開發(fā)者熱情貢獻(xiàn)的,。這些智能體緊貼時(shí)事熱點(diǎn)，如高考志愿填報(bào)助手便是一例,，彰顯了其高度的實(shí)時(shí)性和實(shí)用性,。此外，分類上與其他平臺(tái)相似,，涵蓋了工具類（搜索,、修圖、數(shù)據(jù)分析等）,、娛樂類（搞笑,、角色對話）及生活類（搭配選擇）等多個(gè)領(lǐng)域，滿足不同用戶的多樣化需求,。

04 Agent框架總結(jié)

單智能體= 大語言模型（LLM）觀察（obs）思考（thought）行動(dòng)（act）記憶（mem）

多智能體=智能體環(huán)境 SOP 評審通信成本

多智能體優(yōu)點(diǎn)：

多視角分析問題：雖然LLM可以扮演很多視角,，但會(huì)隨著system prompt或者前幾輪的對話快速坍縮到某個(gè)具體的視角上；
復(fù)雜問題拆解：每個(gè)子agent負(fù)責(zé)解決特定領(lǐng)域的問題,，降低對記憶和prompt長度的要求,；
可操控性強(qiáng)：可以自主的選擇需要的視角和人設(shè)；
開閉原則：通過增加子agent來擴(kuò)展功能,，新增功能無需修改之前的agent,；
（可能）更快的解決問題：解決單agent并發(fā)的問題；

缺點(diǎn)：

成本和耗時(shí)的增加,；
交互更復(fù)雜,、定制開發(fā)成本高,；
簡單的問題single Agent也能解決；

多智能體能解決的問題：

解決復(fù)雜問題,；
生成多角色交互的劇情,；

Multi-Agent并不是Agent框架的終態(tài)，Multi-Agent框架是當(dāng)前有限的LLM能力背景下的產(chǎn)物,，更多還是為了解決當(dāng)前LLM的能力缺陷,，通過LLM多次迭代、彌補(bǔ)一些顯而易見的錯(cuò)誤,，不同框架間仍然存在著極高的學(xué)習(xí)和開發(fā)成本,。隨著LLM能力的提升，未來的Agent框架肯定會(huì)朝著更加的簡單,、易用的方向發(fā)展,。

05 能做什么

可能的方向

游戲場景（npc對話、游戲素材生產(chǎn)）,、內(nèi)容生產(chǎn),、私域助理、OS級(jí)別智能體,、部分工作的提效

Multi-Agent框架

多agent應(yīng)該像人類的大腦一樣,，分工明確、又能一起協(xié)作,，比如,，大腦有負(fù)責(zé)視覺、味覺,、觸覺,、行走、平衡,，甚至控制四肢行走的區(qū)域都不一樣,。

參考MetaGPT和AutoGen生態(tài)最完善的兩個(gè)Multi-Agent框架，可以從以下幾個(gè)角度出發(fā)：

環(huán)境&通訊：Agent間的交互,，消息傳遞,、共同記憶、執(zhí)行順序,，分布式agent,，OS-agent

SOP：定義SOP，編排自定義Agent

評審：Agent健壯性保證,，輸入輸出結(jié)果解析

成本：Agent間的資源分配

Proxy：自定義proxy,，可編程、執(zhí)行大小模型

Single Agent框架

執(zhí)行架構(gòu)優(yōu)化：論文數(shù)據(jù)支撐

CoT to XoT,，從一個(gè)thought一步act到一個(gè)thought多個(gè)act，從鏈?zhǔn)降乃伎挤绞降蕉嗑S度思考,；

長期記憶的優(yōu)化：

具備個(gè)性化能力的agent,，模擬人的回想過程，將長期記憶加入agent中,；

多模態(tài)能力建設(shè)：

agent能觀察到的不僅限于用戶輸入的問題,，可以加入包括觸覺、視覺,、對周圍環(huán)境的感知等,；

自我思考能力：主動(dòng)提出問題，自我優(yōu)化,；

其他

部署：Agent以及workflow的配置化及服務(wù)化,，更長遠(yuǎn)的還需要考慮分布式部署

監(jiān)控：Multi-Agent可視化,、能耗與成本監(jiān)控

RAG：解決語義孤立問題

評測：agent評測、workflow評測,、AgentBench

訓(xùn)練語料：數(shù)據(jù)標(biāo)記,、數(shù)據(jù)回流

業(yè)務(wù)選擇：Copilot 還是 Agent ？Single Agent 還是Multi-Agent,？

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn),。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息，謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,，請點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：張先民 > 《智能體》

舉報(bào)/認(rèn)領(lǐng)