久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

新趨勢(shì),!吳恩達(dá)開(kāi)始強(qiáng)推Agent工作流;智能體平臺(tái)深度體驗(yàn)報(bào)告,;GPTs可能要爛尾??,;萬(wàn)字技術(shù)解析 | ShowMeAI日?qǐng)?bào)

 天承辦公室 2024-03-29 發(fā)布于北京


圖片

最近一兩周還算平靜。國(guó)內(nèi) Kimi 站在了輿論風(fēng)口 ? 專題日?qǐng)?bào),,美國(guó)最吸睛的是 Inflection AI、Stability AI 兩家初創(chuàng)公司的人事變動(dòng),。

其他就是各家大模型和產(chǎn)品的上新迭代,。頗有點(diǎn)春光漸暖、萬(wàn)物勃發(fā)的意象啦 ??

國(guó)內(nèi)

?? 知乎  |  發(fā)布「發(fā)現(xiàn)·AI搜索」功能:在「2024知乎發(fā)現(xiàn)大會(huì)」上,,知乎創(chuàng)始人,、董事長(zhǎng)兼 CEO 周源發(fā)布了全新AI功能「發(fā)現(xiàn)·AI搜索」,以社區(qū)可信賴內(nèi)容為來(lái)源,,給用戶帶來(lái)集搜索,、實(shí)時(shí)問(wèn)答和追問(wèn)功能于一體的全新體驗(yàn)  ? 詳情

?? 淘天 |  即將發(fā)布自研大模型「淘寶星辰」:淘寶天貓集團(tuán)自研大模型「淘寶星辰」官網(wǎng)已經(jīng)準(zhǔn)備好了,或?qū)⒃诓痪谜綄?duì)外開(kāi)放,。淘寶星辰是淘天集團(tuán)公開(kāi)的首個(gè)自研大模型,,可以為商家提供文案編寫(xiě)、商家運(yùn)營(yíng),、數(shù)據(jù)分析,、市場(chǎng)營(yíng)銷策略等智能服務(wù),也可以為消費(fèi)者提供生活服務(wù)推薦,、商品智能搜索,、商品喜好推薦等智能服務(wù)   ? 詳情

?? 360  |  發(fā)布「360安全大模型3.0」:該模型在構(gòu)建框架時(shí)充分參考人類大腦的運(yùn)行邏輯,不僅實(shí)現(xiàn)安全基礎(chǔ)知識(shí)問(wèn)答,、初級(jí)腳本分析等基礎(chǔ)能力,,而且錨定安全行業(yè)痛點(diǎn),、革新安全能力體系、引領(lǐng)未來(lái)安全實(shí)戰(zhàn)   ? 詳情

?? 騰訊  |  混元大模型參數(shù)規(guī)模擴(kuò)展至萬(wàn)億騰訊在財(cái)報(bào)中首度披露騰訊混元采用混合專家模型結(jié)構(gòu),,已擴(kuò)展為萬(wàn)億參數(shù)規(guī)模,。目前,騰訊混元大模型已具備文生圖,、視頻生成等能力,。騰訊內(nèi)部超過(guò)400個(gè)業(yè)務(wù)及場(chǎng)景已接入騰訊混元測(cè)試  ? 詳情

美國(guó)

?? Apple  |  尋求操作系統(tǒng)的外部大模型合作方:最近陸續(xù)有消息爆出,蘋(píng)果公司正在與多家大模型公司洽談,,尋求外部大模型為其 iPhone 設(shè)備提供生成式AI能力,。從目前透露的消息來(lái)看,海外合作方選了 Google Gemini,,中國(guó)選了百度   ? 詳情

?? OpenAI  |  開(kāi)始向好萊塢推銷 Sora:OpenAI  在美國(guó)洛杉磯與好萊塢制片廠,、媒體高管、人才經(jīng)紀(jì)公司舉行會(huì)議,,希望同娛樂(lè)行業(yè)建立合作伙伴關(guān)系,,并鼓勵(lì)電影制作人將 OpenAI Sora 整合到其創(chuàng)作過(guò)程中,還發(fā)布了與藝術(shù)家們合作生成的視頻  ? 詳情

?? Mistral AI  | 突然宣布開(kāi)源新模型:前幾天在一場(chǎng)黑客松活動(dòng)現(xiàn)場(chǎng),,Mistral AI 突然宣布開(kāi)源  Mistral 7B v0.2 Base Model,,它是 Mistral-7B-Instruct-v0.2 背后的原始預(yù)訓(xùn)練模型。此次更新主要包括三個(gè)方面:將 8K 上下文提到了 32K,;Rope Theta = 1e6,;取消滑動(dòng)窗口  ? 詳情

?? Stability AI  |  核心技術(shù)團(tuán)隊(duì)和 CEO 紛紛離職:公司發(fā)布官方公告,稱 Emad Mostaque 辭去 CEO 及公司董事會(huì)職務(wù),,以追求去中心化的AI,。加上此前參與 Stable Diffusion 模型研發(fā)的關(guān)鍵AI研究員都已離開(kāi),公司已經(jīng)相繼失去了十幾位技術(shù)人才,,風(fēng)雨飄搖   ? 詳情

?? Inflection AI  |  賣身微軟談了個(gè)好價(jià)錢(qián)微軟官方發(fā)文宣布創(chuàng)業(yè)公司 Inflection AI 的 CEO ,、首席科學(xué)家、核心科研團(tuán)隊(duì)一并入職微軟,,幾乎掏空了這家公司,。隨后,知情人士透露,,微軟已同意向 Inflection AI 支付約6.5億美元,,以許可協(xié)議的形式使 Inflection AI的模型可以在微軟 Azure 云服務(wù)上銷售,幫助其投資者獲得適度的資本回報(bào),。此外,,微軟還同意向 Inflection AI 支付1.4億美元的信貸額度和約 3000 萬(wàn)美元的大模型相關(guān)權(quán)利費(fèi)用  ? 詳情



?? OpenAI GPTs 項(xiàng)目要爛尾?「小甜甜」短短兩個(gè)月已成「牛夫人」

圖片

https://community./t/techcrunch-article-openais-chatbot-store-is-filling-up-with-spam/692772

2023年11月,,OpenAI 上線 GPTs 功能,,全球AI開(kāi)發(fā)者聞風(fēng)而動(dòng),;2024年1月,OpenAI 正式上線 GPT Store,,開(kāi)啟了構(gòu)建AI 智能體的風(fēng)潮,。

然而,被開(kāi)發(fā)者們寄予厚望的 GPT Store 情況不太樂(lè)觀,,似乎要跟 ChatGPT Plugins 一樣以「爛尾」收?qǐng)觥?/strong>

The Information 和 TechCrunch 近期都發(fā)文指出了 OpenAI GPT Store 存在的一些亂項(xiàng),,主要是平臺(tái)的垃圾 GPTs 太多了

  1. 侵犯知識(shí)產(chǎn)權(quán):很多 GPTs 是關(guān)于熱門(mén)電影,、電視劇,、電子游戲的,這些沒(méi)有經(jīng)過(guò)授權(quán)的開(kāi)發(fā)行為已經(jīng)游走在法律邊緣了,。

  2. 挑戰(zhàn)學(xué)術(shù)倫理:有些 GPTs 標(biāo)明可以完成論文的不正當(dāng)抄襲和改寫(xiě),,甚至宣稱可以繞過(guò)AI內(nèi)容檢測(cè)器,這嚴(yán)重違背了學(xué)術(shù)道德,。

  3. 冒充名人/官方:大量 GPTs 冒充公眾人物和知名企業(yè),,讓用戶誤以為是官方運(yùn)營(yíng)或認(rèn)可的。

  4. 越獄模型泛濫:一些模型聲稱能夠繞過(guò) OpenAI的內(nèi)容審查規(guī)則,,生成諸如暴力,、色情、仇恨等「越獄」內(nèi)容 (實(shí)測(cè)做不到),。


當(dāng)然,,更棘手的是 OpenAI 與開(kāi)發(fā)者們的關(guān)系正在惡化。官方糟糕的運(yùn)營(yíng)政策和表現(xiàn),,讓開(kāi)發(fā)者們的期待重重摔在了地上。概括起來(lái)有兩點(diǎn):

  1. 有人敗興而歸:開(kāi)發(fā)者制作的 GPTs 沒(méi)什么人使用,,官方不分配流量也沒(méi)有渠道進(jìn)行營(yíng)銷,,一段時(shí)間后就放棄了。而使用者進(jìn)入到 GPT Store 嘗試了幾個(gè)垃圾 GPTs 后也就興致缺缺地離開(kāi)了,。

  2. 有人胡作非為:部分開(kāi)發(fā)者「歪腦筋」太多了,,聊幾句之后讓 GPTs 引導(dǎo)用戶去第三方付費(fèi),有些甚至是公然剽竊站內(nèi)已有的 GPTs,。

  3. 官方?jīng)]有回應(yīng):一方面,,開(kāi)發(fā)者對(duì) OpenAI 「暴殄天物」的行為感到失望,擁有全世界最強(qiáng)的大模型,,卻在產(chǎn)品設(shè)計(jì)方面如此拉跨,;另一方面,這樣一款聲勢(shì)浩大的產(chǎn)品,,竟然沒(méi)有設(shè)置 GPTs 開(kāi)發(fā)門(mén)檻,,也沒(méi)有優(yōu)質(zhì)內(nèi)容激勵(lì)措施,,而且無(wú)力應(yīng)對(duì)審查挑戰(zhàn),OpenAI 似乎揭開(kāi)了自己的短板,,又一次,。



?? (目前) 最完整的 AI Agent 開(kāi)發(fā)體驗(yàn)報(bào)告:除了 GPTs,這10個(gè)智能體平臺(tái)也很好用

圖片

補(bǔ)充一份背景:在比較寬泛的語(yǔ)境里,,AI Agent = 智能體 = GPTs = Bot,,都是基于大模型能力構(gòu)建完成特定任務(wù)的聊天機(jī)器人,比如小說(shuō)寫(xiě)作,、新聞搜集,、人物對(duì)話等等。

如果我想創(chuàng)建一個(gè)比較專業(yè)的智能體,,應(yīng)該選擇哪個(gè)平臺(tái)呢,?Coze,扣子,,Dify,,天工 SkyAgents… 它們有什么區(qū)別 & 有哪些操作注意事項(xiàng)?

這篇文章可以解答你這些疑問(wèn)??!

作者是一名資深的 AI Agent 開(kāi)發(fā)者和用戶,在深度使用十多款 Agent 創(chuàng)作平臺(tái)后,,詳細(xì)記錄了它們的特點(diǎn),、優(yōu)勢(shì)和局限性。滿滿都是實(shí)戰(zhàn)經(jīng)驗(yàn)哇~  ? 這篇可以收藏

分類

  1. 第一類 | AI+插件coze / 扣子,、Dify,、百度 · 千帆 AppBuilder、昆侖萬(wàn)維 · 天工 SkyAgents,、釘釘 · AI 助理  |  產(chǎn)品邏輯都是通過(guò) Prompt,、插件等給大語(yǔ)言模型帶上附加功能,操作有相似之處,,使用門(mén)檻不高 ,。
  • 插件功能:coze/扣子的插件最豐富,千帆 AppBuilder 的圖像識(shí)別類插件最豐富

  • 工作流功能:天工 SkyAgents 工作流提供了一些預(yù)設(shè)的大模型功能,,釘釘 AI 助理工作流嵌入了一些釘釘內(nèi)部功能,,Dify 應(yīng)該是準(zhǔn)備中

  • Multi-Agent 模式:目前只有 coze/扣子提供

  • 發(fā)布方式:Dify、千帆 AppBuilder,、天工 SkyAgents  都可以生成網(wǎng)頁(yè),,扣子可以發(fā)布到飛書(shū),釘釘 AI 助理必須在釘釘內(nèi)部使用

  1. 第二類 | 以工作流為核心Botpress、Voiceflow,、Zapier  |  自動(dòng)化流程的工具,,只不過(guò)也可以提供 AI 作為工作流的一部分,適用于創(chuàng)建復(fù)雜工作流的需求 ,。

  2. 第三類 | 關(guān)注任務(wù)分解Ai Agent,、Reworkd AI  |  能夠自己完成任務(wù)的步驟分解,主動(dòng)跟用戶互動(dòng)來(lái)明確執(zhí)行流程。


第一類 | AI + 插件

圖片

coze / 扣子

優(yōu)點(diǎn):① 綜合能力和易用性排到前列;② 設(shè)計(jì)流程靈活,,無(wú)需預(yù)先選擇bot分類,;③ 頁(yè)面即使空空如也也能夠進(jìn)行對(duì)話,;

缺點(diǎn):① 工作流調(diào)用不穩(wěn)定,存在不按指令調(diào)動(dòng)或調(diào)用超時(shí)等問(wèn)題;② 多Agent模式下意圖識(shí)別可能存在問(wèn)題 ;③ 當(dāng)前知識(shí)庫(kù)作為一個(gè)單獨(dú)節(jié)點(diǎn)輸入輸出太受限,。


圖片

Dify

優(yōu)點(diǎn):① 多模型輸出結(jié)果對(duì)比,幫助用戶選擇最佳答案,;② 自動(dòng)生成變量,,簡(jiǎn)化工作流設(shè)計(jì);③ 開(kāi)啟「標(biāo)注回復(fù)」功能,,可以在用戶重讀輸入時(shí)提高響應(yīng)速度,,也可以手動(dòng)編輯特定標(biāo)準(zhǔn)回復(fù)。


圖片

千帆 AppBuilder

優(yōu)點(diǎn):① 提供了多種圖像識(shí)別插件,;② 發(fā)布渠道友好,,支持個(gè)人認(rèn)證的微信公眾號(hào)。


圖片

天工 SkyAgents

優(yōu)點(diǎn):① 提供了額外的信息處理節(jié)點(diǎn),,幫助構(gòu)建更智能的工作流,;② 部分操作預(yù)設(shè)了 Prompt,簡(jiǎn)化操作流程,;③ 界面設(shè)計(jì)對(duì)用戶操作比價(jià)友好,。

缺點(diǎn):① 創(chuàng)建好的規(guī)劃無(wú)法在當(dāng)前頁(yè)面測(cè)試,測(cè)試環(huán)節(jié)不夠直觀,,可能影響調(diào)試效率。


圖片

釘釘AI助理

優(yōu)點(diǎn):① 提供了詳細(xì)的使用教程和操作示例,;② 功能模塊與釘釘生態(tài)緊密結(jié)合,,適合企業(yè)內(nèi)部使用;③ 業(yè)務(wù)工作流實(shí)現(xiàn)自動(dòng)化,,特別適合小型創(chuàng)業(yè)團(tuán)隊(duì) ,。

缺點(diǎn):① 功能受限于釘釘平臺(tái)。


第二類 | 以工作流為核心

圖片

Botpress

優(yōu)點(diǎn):① 能夠?qū)崿F(xiàn)復(fù)雜的工作流和邏輯跳轉(zhuǎn),適合高度定制化的需求,;② 支持持續(xù)接收用戶輸入并提供多樣功能,,增強(qiáng)了bot的交互性。

缺點(diǎn):① 學(xué)習(xí)門(mén)檻較高,,產(chǎn)品設(shè)計(jì)可能顯得混亂,;② 參數(shù)配置分散,用戶可能需要花費(fèi)更多時(shí)間來(lái)熟悉和設(shè)置,。


圖片

Voiceflow (優(yōu)點(diǎn)同上)


圖片

Zapier

優(yōu)點(diǎn):① 同上,;② Prompt 格式全面,Actions 板塊進(jìn)入工作流設(shè)置,;③ 工作流和能接入的 App 非常豐富,。


第三類 | 關(guān)注任務(wù)分解

圖片

Reworkd AI

優(yōu)點(diǎn):① 能夠自動(dòng)進(jìn)行任務(wù)分解,提供分階段的結(jié)果輸出,;② 界面直觀,,允許用戶看到AI的工作流程 。

缺點(diǎn):① 不能根據(jù)輸入依次執(zhí)行任務(wù),,只能執(zhí)行當(dāng)前一次輸入的任務(wù)拆分,。


圖片

Ai Agent

優(yōu)點(diǎn):① 同上;② 允許用戶在任務(wù)后添加補(bǔ)充任務(wù),,增強(qiáng)了靈活性,。

缺點(diǎn):① 同上。



?? 吳恩達(dá)強(qiáng)推,!今年 AI Agent Workflow (智能體工作流) 將成為重要趨勢(shì)

圖片

https://www./the-batch/issue-241

補(bǔ)充一份背景:吳恩達(dá)(Andrew Ng)是AI領(lǐng)域最權(quán)威的學(xué)者之一,,曾擔(dān)任斯坦福大學(xué)副教授,是 Google Brain 的創(chuàng)建者和領(lǐng)導(dǎo)者之一,,也曾回國(guó)擔(dān)任百度首席科學(xué)家并領(lǐng)導(dǎo) Baidu Brain 項(xiàng)目,,離職后創(chuàng)辦 DeepLearning.AI 致力教育和研究。此外,,他也是知名在線教育平臺(tái) Coursera 聯(lián)合創(chuàng)始人,。

要多留心上條提到的 WorkFlow (工作流) 功能了!

最近,,吳恩達(dá)分享了團(tuán)隊(duì)關(guān)于 Agent Workflow (智能體工作流) 的研究成果,,預(yù)測(cè)這將成為今年的流行趨勢(shì)

?? 如上圖所示,,零樣本 (Zero-shot) 模式下的 GPT-4 在 HumanEval (代碼生成測(cè)評(píng)數(shù)據(jù)集) 上的準(zhǔn)確率也只有 67.0%,,經(jīng)過(guò) Agent Workflow 加持的 GPT-3.5 準(zhǔn)確率能飆升到驚人的 95.1%

也就是說(shuō),,Agent Workflow 能帶來(lái)顯著的效果提升,。


文章寫(xiě)作為例,。零樣本(Zero-Shot)指的是大語(yǔ)言模型在沒(méi)有進(jìn)行迭代修正的情況下直接生成最終輸出,類似于人類在不回退刪除的情況下一次性寫(xiě)完一篇文章,。

但是,,更符合人類寫(xiě)作經(jīng)驗(yàn)的模式,是拆分成多個(gè)步驟,,例如規(guī)劃大綱,、檢索資料、撰寫(xiě)初稿,、審閱初稿,、修訂草稿等,也就是上文提到的 Agent Workflow (智能體工作流),。


此外,,吳恩達(dá)簡(jiǎn)單列舉了幾種團(tuán)隊(duì)驗(yàn)證有效的 Agent 設(shè)計(jì)模式,并預(yù)告會(huì)進(jìn)行詳細(xì)介紹,,感興趣關(guān)注一下他的 X 賬號(hào)叭 ??

  • 反思(Reflection):讓大語(yǔ)言模型對(duì)自己的結(jié)果檢查改進(jìn)

  • 使用工具(Tool use):讓大語(yǔ)言模型調(diào)用外部工具,,如網(wǎng)絡(luò)搜索、代碼執(zhí)行等

  • 規(guī)劃(Planning):讓大語(yǔ)言模型自己設(shè)計(jì)一個(gè)多步驟的計(jì)劃來(lái)達(dá)成目標(biāo)

  • 多智能體協(xié)作(Multi-agent collaboration):多個(gè) AI 智能體協(xié)同工作,,分配任務(wù),,討論和辯論想法,寫(xiě)作得到更好的結(jié)果



?? 如何把握 AI Agent 的創(chuàng)業(yè)時(shí)機(jī),,以及當(dāng)下必知的行業(yè)共識(shí)

圖片

但過(guò)去一年時(shí)間,,Agent 的飛速發(fā)展超出了我們預(yù)期,并且快速取得了行業(yè)共識(shí),,成為承載大模型應(yīng)用的基本范式,。圍繞 Agent 正在逐步形成一套系統(tǒng)的方法論,和吸引了無(wú)數(shù)開(kāi)發(fā)者,、創(chuàng)業(yè)公司,、資本及巨頭的關(guān)注。

如果你想快速了解行業(yè)發(fā)展脈絡(luò),、跟上行業(yè)共識(shí),,那最少需要了解以下內(nèi)容:

AI Agent 發(fā)展大事記

  • 2023年3月,微軟發(fā)布 Microsoft 365 Copilot,,提示了一種基于 LLM 的應(yīng)用開(kāi)發(fā)范式,,也就是今天形成行業(yè)共識(shí)的 Agent。

  • 2023年4月,,以 AutoGPT 為代表的 Autonomous Agent 熱度快速躥升,,同期比較受關(guān)注的類似項(xiàng)目還有 TaskMatrix.ai、HuggingGPT,、AgentGPT、Toolformer、BabyAGI 等等,。

  • 2023年6月,,Lilian Weng 發(fā)布知名博文「LLM Powered Autonomous Agents」,進(jìn)一步推升了 Agent 的熱度,。

  • 隨后,,Multi-Agent 框架相繼發(fā)布并展示了解決復(fù)雜問(wèn)題的能力,目前比較火的包括 Camel,、MetaGPT,、AutoGen。

  • 2023年11月,,OpenAI 舉辦開(kāi)發(fā)者大會(huì) DevDay,,推出官方 Agent 開(kāi)發(fā)框架 Assistant API,使開(kāi)發(fā)者能基于 GPT 模型開(kāi)發(fā) Agent,。

  • 2024年1月,,OpenAI 正式發(fā)布定制化 GPTs 和 GPT mentions,并隨后上線 GPTStore,。字節(jié)跳動(dòng)海外版 Coze / 國(guó)內(nèi)版扣子,、Dify、百度千,、天工,、釘釘?shù)葒?guó)產(chǎn) Agent 開(kāi)發(fā)部署平臺(tái)陸續(xù)被廣大開(kāi)發(fā)者熟知。


11 個(gè)頂級(jí)開(kāi)源 Agent 框架

  1. AutoGPT:基于中島洋平的論文開(kāi)發(fā),,是一個(gè)用于構(gòu)建和運(yùn)行定制AI代理的工具包,,使用OpenAI的GPT-4和GPT-3.5大型語(yǔ)言模型。
    https://github.com/Significant-Gravitas/AutoGPT

  2. BabyAGI:中山的任務(wù)驅(qū)動(dòng)自主代理的簡(jiǎn)化版本,,這個(gè)Python腳本只有140行代碼,,使用OpenAI和向量數(shù)據(jù)庫(kù)來(lái)創(chuàng)建、優(yōu)先處理和執(zhí)行任務(wù),。
    https://github.com/yoheinakajima/babyagi

  3. SuperAGI:AutoGPT的更靈活,、用戶友好的替代品,包含構(gòu)建,、維護(hù)和運(yùn)行自己代理所需的一切,,包括插件和一個(gè)云版本。
    https://github.com/TransformerOptimus/SuperAGI

  4. ShortGPT:一個(gè)框架,,允許使用大型語(yǔ)言模型來(lái)簡(jiǎn)化視頻創(chuàng)作,、語(yǔ)音合成和編輯等復(fù)雜任務(wù)
    https://github.com/RayVentura/ShortGPT

  5. ChatDev:被打造成「一個(gè)虛擬軟件公司」,,使用多個(gè)代理人扮演傳統(tǒng)開(kāi)發(fā)組織中的不同角色,,合作處理各種任務(wù),。
    https://github.com/OpenBMB/ChatDev

  6. AutoGen:微軟開(kāi)發(fā)的用于開(kāi)發(fā)和部署多個(gè)代理的開(kāi)源框架,這些代理可以共同工作以自主實(shí)現(xiàn)目標(biāo),。
    https://github.com/microsoft/autogen

  7. MetaGPT:模仿傳統(tǒng)軟件公司結(jié)構(gòu)的框架,,代理被分配為產(chǎn)品經(jīng)理、項(xiàng)目經(jīng)理和工程師的角色,,并協(xié)作完成用戶定義的編碼任務(wù),。
    https://github.com/geekan/MetaGPT

  8. camel:早期的多智能體框架之一,采用獨(dú)特的角色扮演設(shè)計(jì),,使多個(gè)智能體能夠相互通信和合作,。
    https://github.com/camel-ai/camel

  9. Loop GPT:Toran Bruce Richards 的 AutoGPT 的一個(gè)迭代版本,改進(jìn)了對(duì) GPT-3.5 的支持,,集成和自定義代理能力,。
    https://github.com/farizrahman4u/loopgpt/tree/main

  10. JARVIS:以 ChatGPT 作為其「決策引擎」,處理任務(wù)規(guī)劃,、模型選擇,、任務(wù)執(zhí)行和內(nèi)容生成
    https://github.com/microsoft/JARVIS

  11. OpenAGI:一個(gè)開(kāi)源的AGI(人工通用智能)研究平臺(tái),,結(jié)合了小型專家模型和來(lái)自任務(wù)反饋的強(qiáng)化學(xué)習(xí)(RLTF)來(lái)改進(jìn)它們的輸出,。
    https://github.com/agiresearch/OpenAGI


LLM based Agent 初創(chuàng)公司分類

中間層infra:這類公司專注于提供實(shí)用的 Agent 框架,降低開(kāi)發(fā) Agent 的復(fù)雜性,,并促進(jìn) Agent 間的合作,。

  • 拿到知名機(jī)構(gòu)投資的代表項(xiàng)目包括 AutoGPT、Imbue,、Voiceflow,、Fixie AI、Reworked,、Cognosys,、Induced ai等。

Vertical Agent:這類公司深入特定的行業(yè)領(lǐng)域,,理解專家的工作流程,,并運(yùn)用 Agent 的思路來(lái)設(shè)計(jì)產(chǎn)品。

  • 拿到知名機(jī)構(gòu)投資的代表項(xiàng)目包括:Dropzone(安全領(lǐng)域),、Middleware(大模型可觀察性領(lǐng)域),、Parcha(Fintech領(lǐng)域)、Luda(游戲領(lǐng)域),、Outbound AI(醫(yī)療領(lǐng)域),、Fine(軟件開(kāi)發(fā)領(lǐng)域)。


創(chuàng)業(yè)建議

微軟亞研院首席研究經(jīng)理 譚旭

  • AI Agent 領(lǐng)域如何構(gòu)筑護(hù)城河:要深入到 AI Agent 各個(gè)環(huán)節(jié),,提升其解決實(shí)際需求的能力,,并在實(shí)際場(chǎng)景中得到優(yōu)化方向的反饋,。但是,AI Agent領(lǐng)域目前缺乏一個(gè)評(píng)估體系,,指導(dǎo)這個(gè)設(shè)計(jì)和優(yōu)化過(guò)程,。

  • 阻礙相關(guān)研究落地的主因在于效果:目前唯一的瓶頸是現(xiàn)有研究效果無(wú)法達(dá)到落地指標(biāo),只有 AI 的效果能夠真正達(dá)到我們的需求標(biāo)準(zhǔn)時(shí),,才會(huì)被大規(guī)模廣泛使用

來(lái)也科技聯(lián)合創(chuàng)始人&CTO 胡一川

  • AI Agent 落地?cái)?shù)字員工時(shí)的挑戰(zhàn):① 模型的能力需要更強(qiáng),,因?yàn)闃I(yè)務(wù)復(fù)雜度可能超出現(xiàn)有模型的能力,;② 應(yīng)用生態(tài)需要更開(kāi)放;③ 許多工作流程需要被優(yōu)化和重構(gòu),,以適應(yīng) AI Agent 的運(yùn)作方式,。

  • 開(kāi)發(fā)者選擇大模型時(shí)的三個(gè)考量指標(biāo):① 效果考量,即需要在特定領(lǐng)域任務(wù)中表現(xiàn)出色,;② 成本考量,;③ 開(kāi)源與閉源,服務(wù)B端客戶時(shí)需要結(jié)合開(kāi)源模型建立數(shù)據(jù)閉環(huán),。

真格基金管理合伙人 戴雨森

  • 回溯移動(dòng)互聯(lián)時(shí)代,,對(duì)于中國(guó)早期AI創(chuàng)業(yè)者的三條建議:① 要靈活,用動(dòng)態(tài)的眼光看待技術(shù)本身,,適應(yīng)技術(shù)的高速發(fā)展變化,;② 商業(yè)化應(yīng)先關(guān)注用戶新增,再思考用戶留存,;③ 先關(guān)注用戶價(jià)值,,再思考商業(yè)模式,如果產(chǎn)品能帶來(lái)用戶價(jià)值,,就始終有辦法從中提取一部分成為商業(yè)化收入,。

  • 創(chuàng)業(yè)公司如何把握入場(chǎng)時(shí)機(jī):① 創(chuàng)業(yè)需要尋找大趨勢(shì)和小拐點(diǎn)結(jié)合的時(shí)機(jī),然后迅速做出行動(dòng),;② 從經(jīng)驗(yàn)注意的角度出發(fā),,如果你相信一件事遲早會(huì)發(fā)生,那么剋有每隔五年嘗試一次,。

真格基金EIR 季逸超

  • 不去搶有限的時(shí)間:讓用戶愿意為價(jià)值付費(fèi):① 在新平臺(tái)出現(xiàn)之前,, To C 創(chuàng)業(yè)者都是在與 TikTok/抖音爭(zhēng)用戶的注意力和時(shí)間;② (爭(zhēng)不過(guò)) 所以,,要尋找不需要長(zhǎng)時(shí)間交互,,但用戶愿意付費(fèi)的服務(wù)機(jī)會(huì);③ 也就是說(shuō),,不再跟成熟的產(chǎn)品去搶占用戶有限的時(shí)間,。

? 引用參考1   |   引用參考2  |  引用參考3  |  ? 引用參考4



?? 萬(wàn)字長(zhǎng)文:從第一性原理看大模型 Agent 技術(shù),,掰開(kāi)揉碎講技術(shù)演變的原理

補(bǔ)充一份背景:第一性原理 (First Principles) 是一種基本的、不可推導(dǎo)的命題或假設(shè),,構(gòu)成了一個(gè)理論體系或解釋的基礎(chǔ),。可以理解為「探索問(wèn)題的本質(zhì)」,。

想了解 Agent 技術(shù)原理但不想啃論文,?那 @鄧范鑫 這次分享一定合你胃口!

視頻時(shí)長(zhǎng)1個(gè)小時(shí),,文稿字?jǐn)?shù)過(guò)萬(wàn),,將近 40 份參考資料/文獻(xiàn),是 Agent 技術(shù)科普的入門(mén)必讀指南,。

文章梳理了 Agent 技術(shù)的發(fā)展路徑,,以及這條時(shí)間線上的主要研究和關(guān)鍵結(jié)論。脈絡(luò)清晰,,環(huán)環(huán)相扣,。此外,還介紹了通用智能原理,、面向目標(biāo)架構(gòu)這個(gè)兩個(gè)根本性問(wèn)題,,以及基于的架構(gòu)缺陷和未來(lái)可能的發(fā)展方向  ? 點(diǎn)擊閱讀長(zhǎng)文


開(kāi)篇亮明觀點(diǎn):未來(lái)5到10年可能有一場(chǎng)大變局:99%的開(kāi)發(fā)/設(shè)計(jì)/文字工作將被AI接管,人類開(kāi)始進(jìn)入智能時(shí)代,。而智能時(shí)代的核心載體,,不是網(wǎng)站也不是 App,而是 Agent (智能體),。

LLM Agents 發(fā)展歷程

  • Prompt 工程:大模型剛出來(lái)的時(shí)候被當(dāng)作一種編程語(yǔ)言,,用戶通過(guò)角色扮演、零樣本提示,、少樣本提示等工程技巧,,引導(dǎo)大模型的輸出。

  • Prompt 外掛:為了克服大模型自身的諸多局限性 (如不能及時(shí)更新知識(shí),、上下文有限等),,用戶開(kāi)始通過(guò)加入插件 (向量數(shù)據(jù)庫(kù))、調(diào)用外部工具 (ChatGPT Plugins 開(kāi)放體系) 來(lái)增強(qiáng)功能,。

  • 分解與組合:大模型推理能力存在顯著天花板,,因此完成復(fù)雜任務(wù)需要考慮執(zhí)行策略,比如分解和組合 (MapReduce 模式,、思維鏈 CoT /思維樹(shù) ToT / 思維圖 GoT,、累計(jì)推理等)。

  • 反饋:任務(wù)的分解和組合策略缺少與外界互動(dòng)的能力,因此需要借鑒 ReACT 增加反饋機(jī)制,,還可以借鑒強(qiáng)化學(xué)習(xí) Reflection 機(jī)制積累經(jīng)驗(yàn) → 對(duì)應(yīng) OpenAI 推出的 Funtion Calling,。

  • Agent:2023年4月 AutoGPT 橫空出世,這種更徹底的技術(shù)變革正式宣布了 Agent  時(shí)代的到來(lái),。

  • Multi-Agent:多智能體也應(yīng)運(yùn)而生,,比如「斯坦福小鎮(zhèn)」、MetaGPT,、清華 ChatDev 等項(xiàng)目,,都展示了多角色智能體在群體智能涌現(xiàn)方面的潛力

  • 技術(shù)發(fā)展脈絡(luò)與現(xiàn)狀:以上梳理了技術(shù)發(fā)展至今的脈絡(luò),,不過(guò)現(xiàn)有大模型和 Agent 仍然面臨著諸多挑戰(zhàn)挑戰(zhàn),。


通用智能基本原理

  • 大腦的系統(tǒng)1和系統(tǒng)2:系統(tǒng)1 (直覺(jué)系統(tǒng)) 包含快速思考、神經(jīng)網(wǎng)絡(luò)連接主義,、長(zhǎng)期記憶、深度學(xué)習(xí),、亞符號(hào),、潛意識(shí)和非結(jié)構(gòu)化數(shù)據(jù);系統(tǒng)2 (理性系統(tǒng)) 包含意識(shí),、思考,、符號(hào)主義、邏輯推理圖靈,、機(jī)制結(jié)構(gòu)化和模型,。

  • 在構(gòu)建 Agent 時(shí),可以參考這兩種系統(tǒng)的思維框架:在系統(tǒng)2中反復(fù)出現(xiàn)的行為會(huì)逐漸沉淀到系統(tǒng)1中,,也就是同樣的動(dòng)作反復(fù)訓(xùn)練直至變成肌肉記憶和反射 →  稱為Shortcut,。


面向目標(biāo)架構(gòu)

  • 隨著人類的生產(chǎn)方式的變化,軟件工程可能正在逐步演化為智能體工程 (Agent Engineering),,即以AI為中心+人類做輔助,。

  • 例如,傳統(tǒng)的用戶界面,,由于其垂直的任務(wù)層級(jí)架構(gòu),,每一層都需要人類逐一生成,未來(lái)這個(gè)過(guò)程可能會(huì)被智能體自主生成并改良,。


前瞻性分析

  • Central Executive:提出建立中央執(zhí)行機(jī)構(gòu)的概念,,以增強(qiáng)Agent的規(guī)劃和執(zhí)行能力,包括內(nèi)部加工過(guò)程的外部化,。

  • Memory:強(qiáng)調(diào)記憶機(jī)制的重要性,,包括記憶的內(nèi)化、遺忘功能,以及長(zhǎng)短時(shí)記憶與工作記憶之間的關(guān)系,。

  • Sensory:指出多模態(tài)輸入的必要性,,以及時(shí)間感知在運(yùn)動(dòng)控制任務(wù)中的重要性,以及自上而下的機(jī)制問(wèn)題,。

  • Motor:討論運(yùn)動(dòng)控制的未來(lái)發(fā)展,,包括層次化控制和數(shù)據(jù)化執(zhí)行,以及亞符號(hào)的控制方式,。

  • Learning:強(qiáng)調(diào)Agent學(xué)習(xí)過(guò)程中對(duì)自身可靠性的判斷和權(quán)威性的重要性,,以及模型的多樣性和解空間的擴(kuò)展。

  • World Models:提出構(gòu)建無(wú)矛盾,、統(tǒng)一的世界模型的必要性,,以及模型的推理能力和內(nèi)部思考機(jī)制。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購(gòu)買等信息,,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請(qǐng)點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多