保羅·艾倫和我一起創(chuàng)立微軟的至今,,我對軟件的熱愛至今依然不減,。然而,盡管在過去的幾十年中軟件已經(jīng)取得了很大進(jìn)步,,但在很多方面,,軟件還是顯得相當(dāng)“笨拙”。在電腦上執(zhí)行任何任務(wù),,你都需要指定要使用的應(yīng)用程序,。雖然你可以使用微軟Word或谷歌文檔來撰寫商業(yè)提案,但這些工具無法幫助你發(fā)送電子郵件,、分享自拍,、分析數(shù)據(jù)、安排聚會或購買電影票,。即便是最優(yōu)秀的網(wǎng)站,,也僅能片面理解你的工作、個人生活、興趣和人際關(guān)系,,并且在利用這些信息為你服務(wù)方面能力有限,。目前,這種工作通常只能由人類完成,,例如你的密友或個人助理,。 但在未來五年,這一切將徹底改變,。你不再需要為不同的任務(wù)切換不同的應(yīng)用程序,。你只需用平常的語言告訴你的設(shè)備你想做什么。軟件將能夠根據(jù)你愿意分享的信息量,,因為它對你的生活有了深入的了解,,所以能夠做出個性化的響應(yīng)。在不久的將來,,任何一個上網(wǎng)的人都能夠擁有一個由先進(jìn)人工智能驅(qū)動的個人助理,。這類軟件,能夠理解自然語言并根據(jù)對用戶的了解完成多種任務(wù),,被稱為“Agent”,。我對Agent的思考已近30年,在1995年出版的《未來之路》一書中我曾提到過它們,,但直到最近,,因為人工智能的進(jìn)步,它們才真正變得實用,。 Agent不僅將改變?nèi)藗兣c計算機(jī)的互動方式,,還將顛覆軟件行業(yè),引發(fā)自從我們從鍵入命令到點擊圖標(biāo)以來計算機(jī)領(lǐng)域的最大革命,。有批評家指出,,軟件公司以前也提供過類似的服務(wù),但用戶并沒有完全接受,。(人們至今仍然會拿Clippy這個我們曾經(jīng)在微軟Office中加入后來又放棄的數(shù)字助理開玩笑,。)那么,為什么人們會使用Agent呢,?答案是,,Agent將大幅改進(jìn)。你將能夠與它們進(jìn)行更為細(xì)膩的對話,。它們將變得更加個性化,,并不僅僅局限于諸如寫信等相對簡單的任務(wù)。Clippy與Agent之間的差異,,就像旋轉(zhuǎn)電話與智能手機(jī)之間的差異一樣大,。Agent將能夠在你愿意的情況下協(xié)助你完成所有活動,。一旦獲得權(quán)限,Agent可以跟蹤你的在線互動和實際位置,,從而深入了解你所參與的人,、地點和活動。它將掌握你的個人和工作關(guān)系,、興趣愛好,、偏好和日程。你可以選擇何時何地讓它介入?yún)f(xié)助你做決定或幫助完成某項任務(wù),。要了解Agent將帶來的巨大變化,,我們可以將它們與今天的AI工具進(jìn)行對比。這些工具大多是機(jī)器人,,限制在單個應(yīng)用程序中,通常只在你特定提出需求時才會介入,。由于它們無法記住你每次的使用習(xí)慣,,因此無法學(xué)習(xí)并適應(yīng)你的偏好。“Clippy就是一個機(jī)器人,,而不是Agent,。”Agent則更加智能,。它們能夠主動提出建議,,而不僅僅是在你提出請求時才反應(yīng)。它們能夠跨應(yīng)用完成任務(wù),,并且隨著時間的推移不斷進(jìn)步,,因為它們能記住你的活動并識別你行為中的意圖和模式?;谶@些信息,,它們會主動提供它們認(rèn)為你需要的東西,盡管最終決定權(quán)始終掌握在你手中,。想象一下,,你想規(guī)劃一次旅行。一個旅行機(jī)器人可能只能幫你找到符合預(yù)算的酒店,。而Agent則知道你將在哪個季節(jié)出行,,并且根據(jù)它對你是否總是嘗試新目的地或喜歡重復(fù)訪問同一地點的了解,能夠為你提出目的地建議,。在被詢問時,,它還會根據(jù)你的興趣和冒險傾向推薦活動,并為你預(yù)訂你喜愛的餐廳,。如果你今天想要這種深度個性化的規(guī)劃,,你需要支付旅行Agent的費用并花時間告訴他們你的需求,。AIAgent最令人興奮的影響,在于它們將讓今天對大多數(shù)人來說過于昂貴的服務(wù)變得普及,。它們將在醫(yī)療,、教育、生產(chǎn)力以及娛樂和購物等四個領(lǐng)域產(chǎn)生巨大的影響,。在當(dāng)今醫(yī)療保健領(lǐng)域,,人工智能主要是協(xié)助處理行政類任務(wù)。例如,,Abridge,、Nuance DAX和Nabla Copilot等系統(tǒng)可以在醫(yī)生診斷時記錄音頻,并整理成筆記供醫(yī)生審核,。真正的變革將在Agent能夠協(xié)助患者進(jìn)行初步分診,、提供處理健康問題的建議,以及判斷是否需要就醫(yī)時到來,。這些Agent還將助力醫(yī)療工作者做出更明智的決策,,提升其工作效率。(例如,,像Glass Health這樣的應(yīng)用能夠分析患者病情摘要,,并為醫(yī)生提出可能的診斷建議。)對病人和醫(yī)療工作者的幫助,,對于那些貧窮國家的人們尤為重要,,因為在那里很多人根本無法看到醫(yī)生。這些臨床Agent的推廣速度會慢于其他類型,,因為準(zhǔn)確無誤是關(guān)乎生死的大事,。人們需要確信,盡管這些健康A(chǔ)gent不完美且可能犯錯,,但總體上是有益的,。當(dāng)然,人類也會犯錯,,沒有醫(yī)療保健同樣是個問題,。“美國有一半需要心理健康護(hù)理的退伍軍人沒有得到相應(yīng)的治療?!?/span>心理健康護(hù)理是另一個Agent將普及至幾乎所有人的服務(wù)領(lǐng)域,。如今,每周進(jìn)行一次心理治療似乎是一種奢侈,。但實際上,,有很多未被滿足的需求,很多需要心理治療的人卻無法獲得,。例如,,蘭德公司的研究發(fā)現(xiàn),,美國有一半需要心理健康護(hù)理的退伍軍人并未得到治療。經(jīng)過專業(yè)心理健康訓(xùn)練的AIAgent將使心理治療變得更加經(jīng)濟(jì)實惠且易于獲取,。Wysa和Youper是這一領(lǐng)域的兩個早期聊天機(jī)器人示例,。但Agent的作用將更加深入。如果你愿意與心理健康A(chǔ)gent分享充分的信息,,它將能夠理解你的生活歷史和人際關(guān)系,。它會在你需要時隨時待命,永遠(yuǎn)不會感到不耐煩,。有了你的允許,,它甚至可以通過智能手表監(jiān)測你在治療過程中的生理反應(yīng)——比如當(dāng)你談?wù)撆c老板的問題時心跳加速——并建議你何時應(yīng)該尋求人類心理治療師的幫助。幾十年來,,我一直對軟件如何簡化教師工作和幫助學(xué)生學(xué)習(xí)充滿期待,。它不會取代教師,而是會補(bǔ)充他們的工作——為學(xué)生量身定制教學(xué)內(nèi)容,,并讓教師從繁瑣的文書工作和其他任務(wù)中解放出來,,從而有更多時間專注于工作的最重要部分。這些改變終于以顯著的方式開始實現(xiàn),。目前的先進(jìn)技術(shù)是可汗學(xué)院開發(fā)的基于文本的機(jī)器人Khanmigo。它能夠在數(shù)學(xué),、科學(xué)和人文學(xué)科中為學(xué)生提供輔導(dǎo)——例如,,解釋二次方程式并創(chuàng)建數(shù)學(xué)習(xí)題供練習(xí)。它還能幫助教師進(jìn)行課程規(guī)劃等工作,。我長期以來一直是Sal Khan的工作的支持者,,并最近在我的播客中邀請他討論教育和AI。但基于文本的機(jī)器人只是第一步——Agent將開啟更多的學(xué)習(xí)機(jī)會,。例如,,很少有家庭能負(fù)擔(dān)得起為學(xué)生提供一對一輔導(dǎo)來補(bǔ)充課堂學(xué)習(xí)。如果Agent能夠模仿有效家教的特點,,它們將為所有需要的人提供這種補(bǔ)充教學(xué),。如果一個輔導(dǎo)Agent知道一個孩子喜歡Minecraft和泰勒·斯威夫特,它將利用Minecraft來教授體積和面積的計算,,并通過泰勒的歌詞教授講故事和押韻技巧,。與今天的基于文本的輔導(dǎo)相比,這種體驗將更加豐富——例如,,結(jié)合圖形和聲音——并且更加個性化,。在這個領(lǐng)域,競爭已經(jīng)非常激烈,。微軟正在將其Copilot功能集成到Word,、Excel,、Outlook等服務(wù)中。谷歌也在通過助理,、Bard及其生產(chǎn)力工具做著類似的事情,。這些智能助手能完成許多任務(wù),比如將文字文檔轉(zhuǎn)換成幻燈片,,用自然語言回答電子表格相關(guān)問題,,以及在體現(xiàn)每個人觀點的同時總結(jié)電子郵件討論。Agent的能力將更為強(qiáng)大,。擁有一個Agent就像有一個專門協(xié)助你處理各種任務(wù)并在你需要時獨立完成它們的人,。例如,如果你有一個商業(yè)想法,,Agent可以幫你撰寫商業(yè)計劃,,制作演示文稿,甚至生成你產(chǎn)品可能的外觀圖像,。公司可以為員工提供Agent服務(wù),,讓Agent直接參與每次會議,回答問題,。 “如果你的朋友剛做了手術(shù),,你的Agent將主動提出送花,并能為你完成訂花服務(wù),?!?/span>無論你是否在辦公室工作,你的Agent都能像現(xiàn)今的個人助理一樣為你提供幫助,。如果你的朋友最近接受了手術(shù),,你的Agent會主動建議送花,并能幫你完成訂購,。如果你想和大學(xué)室友重聚,,它會與對方的Agent協(xié)作安排見面時間,并在你抵達(dá)前提醒你,,他們的大孩子剛剛開始在當(dāng)?shù)卮髮W(xué)上學(xué),。如今,人工智能已能幫助你挑選新電視,,推薦電影,、書籍、節(jié)目和播客,。同樣,,我投資的一家公司最近推出了Pix,它允許你提出問題(例如,,“我會喜歡哪些羅伯特·雷德福的電影,?我在哪里可以看,?”),然后根據(jù)你過去的喜好做出推薦,。Spotify的AI驅(qū)動DJ不僅根據(jù)你的偏好播放歌曲,,還會與你交流,甚至能稱呼你的名字,。Agent不僅僅會提出推薦,,它們還會幫助你實現(xiàn)這些推薦。如果你想買相機(jī),,你可以讓Agent為你閱讀所有評測,,總結(jié)它們,給出建議,,并在你做出決定后幫你下單,。如果你告訴Agent你想看《星球大戰(zhàn)》,它會知道你是否已訂閱了相應(yīng)的流媒體服務(wù),,如果沒有,,它會提出幫你注冊。如果你不確定想看什么,,它會提供定制化的建議,,然后幫你播放所選的電影或節(jié)目。你還可以獲得根據(jù)你的興趣定制的新聞和娛樂內(nèi)容,。CurioAI就是這一趨勢的一個例子,,它能根據(jù)你提出的任何主題創(chuàng)建定制播客。總之,,Agent將能夠幫助處理幾乎所有活動和生活各個領(lǐng)域的事務(wù)。這對軟件業(yè)和整個社會都將產(chǎn)生深遠(yuǎn)的影響,。在計算行業(yè)中,,我們討論的是平臺——應(yīng)用程序和服務(wù)構(gòu)建的基礎(chǔ)技術(shù)。Android,、iOS和Windows都是平臺的例子,。Agent將成為下一個平臺。 “要創(chuàng)建一個新的應(yīng)用程序或服務(wù),,你只需要告訴你的Agent你的需求,。”要創(chuàng)建一個新的應(yīng)用或服務(wù),,你不需要掌握編程或圖形設(shè)計技能,。你只需告訴你的Agent你的需求。它將能夠編寫代碼,,設(shè)計應(yīng)用的外觀和感覺,,創(chuàng)建一個logo,,并將應(yīng)用發(fā)布到在線商店。OpenAI本周推出的GPTs展示了一個未來預(yù)覽,,即非開發(fā)人員也能輕松創(chuàng)建和分享他們自己的助手,。Agent將影響我們使用軟件的方式以及軟件的編寫方式。它們將取代搜索網(wǎng)站,,因為它們在為你查找和總結(jié)信息方面會更加高效,。它們將取代許多電子商務(wù)網(wǎng)站,因為它們能為你找到最佳價格,,并且不受限于少數(shù)幾個供應(yīng)商,。它們將取代文字處理軟件、電子表格以及其他生產(chǎn)力應(yīng)用,。今天是獨立的業(yè)務(wù)——搜索廣告,、帶廣告的社交網(wǎng)絡(luò)、購物,、生產(chǎn)力軟件——將合并成為一個業(yè)務(wù),。我認(rèn)為不會有任何單一公司主導(dǎo)Agent業(yè)務(wù)——將有許多不同的AI引擎可供選擇。如今,,Agent被嵌入到其他軟件中,,如文字處理軟件和電子表格,但最終它們將獨立運(yùn)作,。雖然一些Agent將免費使用(并通過廣告支持),,但我認(rèn)為你將需要為大多數(shù)Agent付費,這意味著公司將有動力讓Agent代表你的利益,,而不是廣告商的,。今年開始研究AI的公司數(shù)量表明,將會有異常激烈的競爭,,這將使Agent的價格非常親民,。但在我所描述的高級Agent成為現(xiàn)實之前,我們需要面對關(guān)于技術(shù)及其使用方式的諸多問題,。我之前已經(jīng)寫過AI引發(fā)的問題,,所以在這里我將專門聚焦于Agent。目前還沒有人弄清楚Agent的數(shù)據(jù)結(jié)構(gòu)應(yīng)該是怎樣的,。為了創(chuàng)建個人Agent,,我們需要一種新型數(shù)據(jù)庫,它能夠精確捕捉你的興趣和關(guān)系的細(xì)微差別,,并在保護(hù)隱私的同時快速提取這些信息,。我們已經(jīng)開始看到一些新的信息存儲方式,比如向量數(shù)據(jù)庫,這可能更適合存儲由機(jī)器學(xué)習(xí)模型生成的數(shù)據(jù),。還有一個未解之謎是,,人們將與多少個Agent互動。你的個人Agent是否會與你的心理治療Agent和數(shù)學(xué)輔導(dǎo)Agent分開,?如果是這樣,,那么在什么情況下你希望它們相互合作,而什么時候應(yīng)該保持各自的獨立,?“如果你的Agent需要與你聯(lián)系,,它會通過耳機(jī)對你說話,或在你的手機(jī)上顯示信息,?!?/span>你將如何與你的Agent互動?目前公司正在探索包括應(yīng)用程序,、眼鏡,、吊墜、別針,,甚至全息圖在內(nèi)的各種選項,。這些都是可能的方式,但我認(rèn)為人類與Agent互動的首個重大突破將是耳機(jī),。如果你的Agent需要與你聯(lián)系,,它會通過耳機(jī)對你說話,或在你的手機(jī)上顯示信息,。(“你的航班延誤了,。你想等待,還是需要我?guī)湍阒匦骂A(yù)訂,?”)如果你愿意,,它還可以監(jiān)控進(jìn)入你耳朵的聲音,并通過消除背景噪音,、增強(qiáng)難以聽清的語音或使帶有重口音的人說話更容易理解來提升聽覺體驗,。還有其他的挑戰(zhàn)。目前還沒有一個標(biāo)準(zhǔn)的協(xié)議允許Agent之間相互通信,。Agent的成本需要降低,使其對每個人都負(fù)擔(dān)得起,。激活A(yù)gent以獲得正確答案的過程需要更加簡單,。我們需要防止在諸如健康這樣的領(lǐng)域中出現(xiàn)幻覺,因為在這些領(lǐng)域中準(zhǔn)確性至關(guān)重要,,同時確保Agent不會因為偏見而傷害人們,。我們不希望Agent做出它們不應(yīng)該做的事情。(盡管我對惡意Agent的擔(dān)憂少于對人類犯罪分子利用Agent進(jìn)行惡意活動的擔(dān)憂。)隨著這些技術(shù)的融合,,線上隱私和安全問題將比現(xiàn)在更加迫切,。你會希望能夠決定Agent可以訪問哪些信息,以確信你的數(shù)據(jù)只被你選擇的人和公司所共享,。但你與Agent分享的數(shù)據(jù)歸誰所有,,如何確保它被適當(dāng)使用呢?沒有人希望因為他們告訴心理治療Agent的事情而開始收到相關(guān)廣告,。執(zhí)法部門可以使用你的Agent作為對你不利的證據(jù)嗎,?你的Agent什么時候會拒絕做可能對你或他人有害的事情?誰來確定Agent內(nèi)嵌的價值觀,?
|