代理(Agent)乃一種智能實(shí)體,具備自主環(huán)境感知與決策行動(dòng)能力,,旨在達(dá)成既定目標(biāo),。作為個(gè)人或組織之?dāng)?shù)字化替身,AI代理執(zhí)行特定任務(wù)與交易,,其核心價(jià)值在于簡化工作流程,,削減繁復(fù)性,并有效降低人力投入與溝通障礙,,促進(jìn)效率與協(xié)作的雙重提升,。簡而言之,代理技術(shù)讓AI成為高效助手,,助力個(gè)人與組織在復(fù)雜多變的環(huán)境中更加游刃有余,。 01 Agent基礎(chǔ) Agent的核心決策機(jī)制圍繞著動(dòng)態(tài)適應(yīng)與持續(xù)優(yōu)化展開。它使LLM(大型語言模型)能夠依據(jù)實(shí)時(shí)變動(dòng)的環(huán)境信息,,靈活選擇并執(zhí)行恰當(dāng)?shù)男袆?dòng)策略,,或?qū)π袆?dòng)結(jié)果進(jìn)行精準(zhǔn)評估與判斷。這一過程通過多輪迭代不斷重復(fù),,每一次迭代都基于對環(huán)境的深入理解與上一次執(zhí)行效果的反饋,,旨在逐步逼近并最終達(dá)成既定目標(biāo)。Agent的此種運(yùn)作模式,,確保了其在復(fù)雜多變的環(huán)境中能夠保持高效,、靈活與適應(yīng)性,,持續(xù)推動(dòng)任務(wù)向成功邁進(jìn)。 精簡的決策流程:P(感知)→ P(規(guī)劃)→ A(行動(dòng))
工程實(shí)現(xiàn)上可以拆分出四大塊核心模塊:推理,、記憶,、工具、行動(dòng) 02 各平臺(tái)功能總結(jié)與比較 官方GPTs商店:各大平臺(tái)均設(shè)有官方GPTs應(yīng)用商店,,匯聚了琳瑯滿目的插件與模型,,滿足多元化需求。 知識(shí)庫:在知識(shí)庫構(gòu)建上,,各平臺(tái)展現(xiàn)獨(dú)特風(fēng)采,,內(nèi)容既廣泛又深入,助力用戶輕松獲取所需信息,。 流程圖編排: 流程圖編排功能作為標(biāo)配,,讓無編程基礎(chǔ)的用戶也能通過直觀拖拽,迅速構(gòu)建高效工作流,,實(shí)現(xiàn)流程自動(dòng)化,。 多模型支持:對于模型支持,部分平臺(tái)展現(xiàn)開放姿態(tài),,兼容多模型選擇,;而有的則專注于自家大模型深度優(yōu)化,但無論哪種,,均能有效支撐日常工作的順利進(jìn)行,。 插件調(diào)用:插件調(diào)用機(jī)制的引入,極大增強(qiáng)了平臺(tái)的靈活性與擴(kuò)展性,,用戶可根據(jù)實(shí)際需求靈活調(diào)用各類插件,,提升工作效率。 Prompt配置:至于Prompt配置,,各平臺(tái)均展現(xiàn)出創(chuàng)新精神,,提供個(gè)性化、精細(xì)化的配置選項(xiàng),,確保用戶能夠精確控制模型行為,,滿足特定場景下的需求。 03 國內(nèi)主流一站式Agent平臺(tái)深度測評 1.Betteryeah 網(wǎng)址: 斑頭雁智能科技,,其核心團(tuán)隊(duì)源自阿里巴巴釘釘?shù)某鮿?chuàng)精英,,專注于打造零門檻Agent構(gòu)建平臺(tái),,旨在迅速激活并釋放大模型的強(qiáng)大潛力。該平臺(tái)內(nèi)置了包括ChatGLM,、阿里通義千問,、百度千帆在內(nèi)的國內(nèi)外頂尖AI模型,為用戶提供了豐富的選擇,。 產(chǎn)品形態(tài):在產(chǎn)品形態(tài)上,,斑頭雁智能科技與Coze等前沿平臺(tái)并駕齊驅(qū),均屬于高度集成的平臺(tái)型產(chǎn)品,,為用戶提供了一站式解決方案,。 開發(fā)模式:其開發(fā)模式靈活多變,既支持單一Agent的精細(xì)化打造,,也適應(yīng)于Multi-Agent系統(tǒng)的復(fù)雜部署,,滿足不同業(yè)務(wù)場景下的多樣化需求。 應(yīng)用場景:面向企業(yè)級(jí)市場,,斑頭雁智能科技聚焦AI客服,、營銷、銷售等多個(gè)關(guān)鍵領(lǐng)域,,提供智能化升級(jí)的全面解決方案,。 其官方智能體中心更是匯聚了全類別的智能應(yīng)用,從全面的智能客服系統(tǒng),,到針對電商,、銷售、營銷,、HR等多個(gè)垂直行業(yè)的定制化方案,,再到快速上手的學(xué)習(xí)資源,一應(yīng)俱全,,助力企業(yè)輕松實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型與智能化升級(jí),。 2.Coze 網(wǎng)址:https://www. Coze,,作為字節(jié)精心打造的AI Bot開發(fā)旗艦平臺(tái),致力于賦能開發(fā)者,,以強(qiáng)大而簡潔的界面,,加速智能聊天機(jī)器人的設(shè)計(jì)與部署流程。在中文大模型智能體生態(tài)中,,Coze以其先驅(qū)地位傲視群雄,,無論是率先布局的市場先機(jī),還是其在智能體編排工具的成熟度,、插件的廣泛性,、兼容大模型種類的多樣性,,乃至發(fā)布渠道的全面覆蓋,均展現(xiàn)出非凡實(shí)力,。 Coze平臺(tái)慷慨開放,,無論是其自研的云雀大模型,還是外部知名的moonshot等尖端技術(shù),,均對開發(fā)者免費(fèi)開放,,極大地降低了創(chuàng)新門檻。其卓越的用戶體驗(yàn)與龐大的日活用戶數(shù),,共同構(gòu)筑了行業(yè)內(nèi)的領(lǐng)先地位,,無論是從生態(tài)構(gòu)建、用戶體驗(yàn),,還是底層技術(shù)支撐來看,,Coze無疑是眾多智能體平臺(tái)中的佼佼者。 不得不提的是字節(jié)的另一款A(yù)I智能對話助手——豆包,。豆包以其獨(dú)特的prompt驅(qū)動(dòng)方式,讓用戶能夠輕松定制專屬智能體,,其亮點(diǎn)在于無縫集成了先進(jìn)的TTS(文本到語音)技術(shù),,讓自定義的智能體能夠直接與用戶進(jìn)行語音交互,體驗(yàn)更加自然流暢,。相較于Coze的全方位智能體構(gòu)建方案,,豆包更像是一款功能精煉、操作快捷的便攜式Coze版本,,尤其適合在移動(dòng)端快速高效地應(yīng)用,。以下是豆包智能體中心的精彩展示,進(jìn)一步詮釋了其便捷與高效,。 3.百度千帆AgentBuilder 網(wǎng)址:https://agents.baidu.com/ 百度AgentBuilder是一款智能體開發(fā)工具,,旨在降低智能體開發(fā)門檻,,讓每個(gè)人、每個(gè)組織都能夠成為智能體的開發(fā)者,。AgentBuilder是百度推出的三大AI開發(fā)工具之一,,另外兩個(gè)工具分別是AppBuilder和ModelBuilder(小紙條之前的文章給大家介紹過各家產(chǎn)品們的區(qū)別)。 產(chǎn)品形態(tài):基于文心大模型的智能體平臺(tái),,也是平臺(tái)型,。 開發(fā)方式:支持開發(fā)者根據(jù)自身行業(yè)領(lǐng)域和應(yīng)用場景選擇不同類型的開發(fā)方式,提供低成本的prompt編排方式,。 功能特點(diǎn):提供零代碼和低代碼兩種開發(fā)模式,,適合不同技術(shù)背景的開發(fā)者 來看下智能體中心大家都在用什么,,熱門的主要也還是聚焦提效、娛樂,、生活,、以及實(shí)時(shí)熱點(diǎn)的高考。 4.SkyAgents(昆侖萬維) 網(wǎng)址: 昆侖萬維公司隆重推出天工SkyAgents,這是一款引領(lǐng)未來的AI Agents構(gòu)建平臺(tái),,旨在重塑智能應(yīng)用的創(chuàng)造邊界,。 產(chǎn)品形態(tài)創(chuàng)新:天工SkyAgents以其先進(jìn)的技術(shù)架構(gòu),打造了一個(gè)高效,、靈活的AI Agents構(gòu)建生態(tài)系統(tǒng),。該平臺(tái)不僅集成了前沿的人工智能技術(shù),還通過模塊化設(shè)計(jì),,讓AI Agent的創(chuàng)建與部署變得前所未有的簡單快捷,。 開發(fā)體驗(yàn)革新:區(qū)別于傳統(tǒng)繁瑣的開發(fā)流程,天工SkyAgents引入了革命性的開發(fā)方式,。用戶僅需通過自然語言輸入,,即可輕松描述AI Agent的功能與行為;同時(shí),,可視化拖拽界面更是將復(fù)雜的技術(shù)操作簡化為直觀的圖形操作,,深度集成Skywork大語言模型,讓AI Agent的智能化水平躍升至新高度,。 應(yīng)用場景廣泛:天工SkyAgents的智能體,,憑借其強(qiáng)大的感知與決策能力,能夠精準(zhǔn)適配各類具體業(yè)務(wù)場景,。無論是電商平臺(tái)的個(gè)性化推薦,、客服系統(tǒng)的智能應(yīng)答,還是金融領(lǐng)域的風(fēng)險(xiǎn)評估,、智能制造的自動(dòng)化控制,,天工SkyAgents都能以用戶需求為核心,提供定制化的智能解決方案,,助力企業(yè)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型與升級(jí),。 社區(qū)生態(tài)活躍:在天工SkyAgents的智能體中心,一個(gè)充滿活力的社區(qū)生態(tài)正在形成,。這里不僅有官方精心打造的示例Agents,,展示著AI Agent的無限可能與最佳實(shí)踐;更有來自全球的個(gè)人開發(fā)者,,他們通過天工平臺(tái)貢獻(xiàn)自己的智慧與創(chuàng)意,,構(gòu)建了一個(gè)豐富多彩,、不斷更新的Agent市場。這個(gè)市場不僅為開發(fā)者提供了展示自我的舞臺(tái),,更為用戶提供了更多元化,、更個(gè)性化的AI服務(wù)選擇。 綜上所述,,天工SkyAgents以其獨(dú)特的產(chǎn)品形態(tài),、革新的開發(fā)方式、廣泛的應(yīng)用場景以及活躍的社區(qū)生態(tài),,正逐步成為AI Agent構(gòu)建領(lǐng)域的佼佼者,。未來,隨著技術(shù)的不斷進(jìn)步與應(yīng)用的持續(xù)深化,,天工SkyAgents有望引領(lǐng)智能體技術(shù)邁向新的高度,,為人類社會(huì)創(chuàng)造更加美好的智能生活。 5.阿里云魔搭社區(qū) 網(wǎng)址: 產(chǎn)品形態(tài)革新:我們自豪地推出這款專為開源大語言模型(LLM)量身定制的AI Agent開發(fā)框架。它不僅完美兼容并優(yōu)化各類主流LLM,,還提供了一個(gè)高度靈活與可擴(kuò)展的平臺(tái),,讓AI Agent的開發(fā)與部署更加便捷高效。 開發(fā)方式多元化:該框架支持創(chuàng)建多樣化的多模態(tài)AI Agent,,涵蓋客戶服務(wù),、個(gè)人助理等多個(gè)領(lǐng)域,,滿足不同場景下的智能化需求,。用戶可以根據(jù)具體業(yè)務(wù)場景,輕松構(gòu)建出既能處理文本對話,,又能理解圖像,、語音等多類型信息的智能體,實(shí)現(xiàn)全方位的用戶交互體驗(yàn),。 一鍵協(xié)作,,簡化流程:我們深知在AI項(xiàng)目開發(fā)中,模型間的協(xié)作至關(guān)重要,。因此,,該框架創(chuàng)新性地引入了一鍵發(fā)送指令調(diào)用其他AI模型的功能,大幅簡化了模型集成與協(xié)作的流程,。用戶無需深入技術(shù)細(xì)節(jié),,即可輕松實(shí)現(xiàn)多模型間的無縫對接,提升整體項(xiàng)目的智能化水平和響應(yīng)速度,。 低/零代碼平臺(tái),,降低門檻:為了進(jìn)一步降低AI Agent的開發(fā)門檻,,我們結(jié)合了低/零代碼平臺(tái)的設(shè)計(jì)理念,讓非技術(shù)背景的用戶也能參與到AI應(yīng)用的開發(fā)中來,。通過直觀的圖形化界面和豐富的預(yù)設(shè)模板,,用戶可以快速上手,實(shí)現(xiàn)個(gè)性化定制的智能體,,無需編寫復(fù)雜的代碼,。 廣泛適用,未來可期:該框架設(shè)計(jì)之初就充分考慮了未來技術(shù)的發(fā)展趨勢,,因此它不僅適用于當(dāng)前多種業(yè)務(wù)場景,,還具備高度的可擴(kuò)展性和兼容性。隨著開源大模型的不斷涌現(xiàn)與更新,,我們將持續(xù)優(yōu)化該框架,,確保它能夠快速適配更多新增的開源大模型,為用戶提供更加豐富和強(qiáng)大的AI解決方案,。 創(chuàng)建智能體新體驗(yàn):在開源社區(qū)中,,該產(chǎn)品的智能體創(chuàng)建過程同樣令人印象深刻。用戶可以通過對話配置和參數(shù)配置兩種方式,,靈活定義智能體的行為邏輯和外觀樣式,。雖然當(dāng)前版本暫未直接展示workflow流程設(shè)計(jì)界面,但憑借其強(qiáng)大的功能集成和易用性設(shè)計(jì),,我們相信未來版本中將會(huì)引入更多高級(jí)功能,,包括workflow流程編輯器等,以進(jìn)一步提升用戶的開發(fā)體驗(yàn)和智能體的智能化水平,。 6.訊飛的星火友伴 網(wǎng)址: 訊飛科技,,以其深厚的AI技術(shù)底蘊(yùn),,攜手星火V3.0這一強(qiáng)大引擎,精心打造了一個(gè)專注于虛擬人格GPTs應(yīng)用的創(chuàng)新平臺(tái),。該平臺(tái)不僅代表了訊飛在人工智能領(lǐng)域的又一里程碑式成果,,更是為探索個(gè)性化智能交互體驗(yàn)開辟了全新的道路。 智能體中心,,是由訊飛官方精心設(shè)計(jì)的虛擬人格模板,。這些模板各具特色,涵蓋了從親切友善的客服助手到風(fēng)趣幽默的聊天伙伴,,再到專業(yè)嚴(yán)謹(jǐn)?shù)念檰枌?dǎo)師等多種角色設(shè)定,。 用戶可根據(jù)自身需求與偏好,輕松選擇一款合適的模板作為起點(diǎn),也可以通過平臺(tái)的強(qiáng)大功能進(jìn)行二次改造與個(gè)性化定制,。 7.智譜 網(wǎng)址: 智譜清言推出的Agent生成器,,在提供基礎(chǔ)智能體生成能力的同時(shí),,獨(dú)具特色地支持開發(fā)者通過API調(diào)用方式靈活使用智能體。 該API廣泛覆蓋清言C端頁面的核心功能,,包括文本對話,、文生圖、圖片解讀,、聯(lián)網(wǎng)搜索,、文檔解析、Python代碼執(zhí)行及外部API調(diào)用等,。 在智能體中心,,熱門智能體琳瑯滿目,既有官方精心打造的,,也有個(gè)人開發(fā)者熱情貢獻(xiàn)的,。這些智能體緊貼時(shí)事熱點(diǎn),如高考志愿填報(bào)助手便是一例,,彰顯了其高度的實(shí)時(shí)性和實(shí)用性,。此外,分類上與其他平臺(tái)相似,,涵蓋了工具類(搜索,、修圖、數(shù)據(jù)分析等),、娛樂類(搞笑,、角色對話)及生活類(搭配選擇)等多個(gè)領(lǐng)域,滿足不同用戶的多樣化需求,。 04 Agent框架總結(jié) 單智能體= 大語言模型(LLM) 觀察(obs) 思考(thought) 行動(dòng)(act) 記憶(mem) 多智能體=智能體 環(huán)境 SOP 評審 通信 成本 多智能體優(yōu)點(diǎn):
缺點(diǎn):
多智能體能解決的問題:
Multi-Agent并不是Agent框架的終態(tài),Multi-Agent框架是當(dāng)前有限的LLM能力背景下的產(chǎn)物,,更多還是為了解決當(dāng)前LLM的能力缺陷,,通過LLM多次迭代、彌補(bǔ)一些顯而易見的錯(cuò)誤,,不同框架間仍然存在著極高的學(xué)習(xí)和開發(fā)成本,。隨著LLM能力的提升,未來的Agent框架肯定會(huì)朝著更加的簡單,、易用的方向發(fā)展,。 05 能做什么 可能的方向游戲場景(npc對話、游戲素材生產(chǎn)),、內(nèi)容生產(chǎn),、私域助理、OS級(jí)別智能體,、部分工作的提效 Multi-Agent框架多agent應(yīng)該像人類的大腦一樣,,分工明確、又能一起協(xié)作,,比如,,大腦有負(fù)責(zé)視覺、味覺,、觸覺,、行走、平衡,,甚至控制四肢行走的區(qū)域都不一樣,。 參考MetaGPT和AutoGen生態(tài)最完善的兩個(gè)Multi-Agent框架,可以從以下幾個(gè)角度出發(fā): 環(huán)境&通訊:Agent間的交互,,消息傳遞,、共同記憶、執(zhí)行順序,,分布式agent,,OS-agent SOP:定義SOP,編排自定義Agent 評審:Agent健壯性保證,,輸入輸出結(jié)果解析 成本:Agent間的資源分配 Proxy:自定義proxy,,可編程、執(zhí)行大小模型 Single Agent框架執(zhí)行架構(gòu)優(yōu)化:論文數(shù)據(jù)支撐 CoT to XoT,,從一個(gè)thought一步act到一個(gè)thought多個(gè)act,從鏈?zhǔn)降乃伎挤绞降蕉嗑S度思考,; 長期記憶的優(yōu)化: 具備個(gè)性化能力的agent,,模擬人的回想過程,將長期記憶加入agent中,; 多模態(tài)能力建設(shè): agent能觀察到的不僅限于用戶輸入的問題,,可以加入包括觸覺、視覺,、對周圍環(huán)境的感知等,; 自我思考能力:主動(dòng)提出問題,自我優(yōu)化,;
部署:Agent以及workflow的配置化及服務(wù)化,,更長遠(yuǎn)的還需要考慮分布式部署 監(jiān)控:Multi-Agent可視化,、能耗與成本監(jiān)控 RAG:解決語義孤立問題 評測:agent評測、workflow評測,、AgentBench 訓(xùn)練語料:數(shù)據(jù)標(biāo)記,、數(shù)據(jù)回流 業(yè)務(wù)選擇:Copilot 還是 Agent ?Single Agent 還是Multi-Agent,? |
|