從2022年末一直到2023年上半年,,許多人親眼見證了ChatGPT的風(fēng)靡全球,,以及生成式AI與大語言模型的大爆發(fā),。 那么對于廣大用戶來說,生成式AI究竟意味著怎樣的機遇,?數(shù)據(jù)在生成式AI應(yīng)用中扮演著怎樣的角色,?如何解鎖生成式AI的價值?又應(yīng)該怎樣開啟生成式AI的旅程,? 在近日召開的2023亞馬遜云科技中國峰會上,,亞馬遜云科技全球產(chǎn)品副總裁Matt Wood針對以上問題給出了詳細解答。 解鎖生成式AI的價值 “亞馬遜云科技深信,,生成式AI正在重塑千行百業(yè),。它可以突破以前無法突破的極限,其典型場景包括寫作,、設(shè)計,、編碼、建模等創(chuàng)意輸出,;包括搜索,、總結(jié)、排序等功能增強,;包括可產(chǎn)生新知識和新想法,,以及通過聊天機器人提供開放知識的全新交互式體驗;包括在人工監(jiān)督下自動執(zhí)行復(fù)雜任務(wù)的決策支持,?!闭劦絹嗰R遜云科技對生成式AI的觀點與看法時,Matt Wood如是表示,。 談到如何解鎖生成式AI的價值時,,Matt Wood表示主要有以下四個步驟: 1、提供對一流基礎(chǔ)模型的訪問:亞馬遜云科技的Amazon Bedrock服務(wù)能夠提供對一流基礎(chǔ)模型的訪問,,允許用戶通過API訪問來自AI21 Labs,、Anthropic、Stability AI和亞馬遜的基礎(chǔ)模型,,因而是客戶使用基礎(chǔ)模型構(gòu)建和擴展生成式AI應(yīng)用程序的最簡單方法,,幫助所有開發(fā)者降低了使用門檻。在Amazon Bedrock上,,用戶可以通過可擴展,、可靠且安全的亞馬遜云科技托管服務(wù),訪問從文本到圖像的一系列強大的基礎(chǔ)模型,。 2,、提供安全私密的環(huán)境去定制模型:亞馬遜云科技旗下的Amazon Titan是一系列不同的模型庫,可實現(xiàn)文本歸納總結(jié)、搜索結(jié)果嵌入,、有害內(nèi)容刪減等,,用戶可以非常安全、隱私地對這些模型做優(yōu)化和微調(diào),。 3,、通過定制芯片提供低成本和低延遲訪問:從Nitro、Graviton一直到機器學(xué)習(xí)推理芯片Inferentia,、機器學(xué)習(xí)訓(xùn)練芯片Trainium,,亞馬遜云科技低成本、低延遲的自研定制芯片,,正在生成式AI領(lǐng)域展現(xiàn)出越來越明顯的優(yōu)勢,。 4、搜尋機會提升使用體驗:基于機器學(xué)習(xí)技術(shù),,亞馬遜云科技為開發(fā)人員提供了Amazon CodeWhisperer代碼生成服務(wù),,支持包括Java、JavaScript和Python等在內(nèi)的15種不同編程語言,,可以讓個人用戶免費使用,。在測試中,與未使用CodeWhisperer的參與者相比,,使用CodeWhisperer的參與者完成任務(wù)的速度平均快57%,,成功率高27%。 “在為客戶提供廣泛的機器學(xué)習(xí)能力方面,,亞馬遜云科技有著悠久的歷史,。從機器學(xué)習(xí)的不斷創(chuàng)新、定制化的底層芯片,、開箱即用的AI服務(wù)一直到利用Amazon Bedrock使用模型,,如果把所有這些放在一起,你會發(fā)現(xiàn)從未有過如此簡單,、低成本的,,借助機器學(xué)習(xí)進行代碼構(gòu)建的方式?!盡att Wood說道,。 亞馬遜云科技的云原生數(shù)據(jù)戰(zhàn)略 Matt Wood指出,數(shù)據(jù)既是生成式AI的起點,,又將推動生成式AI的廣泛應(yīng)用,。為此亞馬遜云科技也推出了自己的云原生數(shù)據(jù)戰(zhàn)略: 1、全面的工具集,,滿足現(xiàn)在和未來所需:亞馬遜云科技推出15種專門構(gòu)建的云上托管數(shù)據(jù)庫服務(wù),為各類用戶的應(yīng)用場景提供完美契合的數(shù)據(jù)服務(wù);亞馬遜云科技的分析服務(wù)已全面實現(xiàn)Serverless化,,包括交互式查詢服務(wù)Amazon Athena,、大數(shù)據(jù)處理服務(wù)Amazon Managed Streaming for Apache Kafka (Amazon MSK)、實時分析服務(wù)Amazon Kinesis,、數(shù)據(jù)倉庫服務(wù)Amazon Redshift,、數(shù)據(jù)集成服務(wù)Amazon Glue、商業(yè)智能服務(wù)Amazon QuickSight以及運營分析服務(wù)Amazon OpenSearch Service,。 2,、輕松集成,連接所有數(shù)據(jù):亞馬遜云科技提出了Zero-ETL的愿景,,致力于實現(xiàn)無縫的數(shù)據(jù)轉(zhuǎn)換和調(diào)用,,而用戶不用編寫任何的代碼。譬如最近推出的Amazon Aurora服務(wù),,就可以與Amazon Redshift進行Zero-ETL集成,,允許使用Amazon Redshift對來自Aurora的PB級事務(wù)數(shù)據(jù)進行近實時分析和機器學(xué)習(xí)。事務(wù)數(shù)據(jù)在被寫入Aurora后的幾秒鐘內(nèi),,即可用在Amazon Redshift中,,因此用戶不必構(gòu)建和維護復(fù)雜的數(shù)據(jù)管道來執(zhí)行提取、轉(zhuǎn)換和加載 (ETL) 操作,。 3,、構(gòu)建端到端的數(shù)據(jù)治理:通過數(shù)據(jù)治理,加速并保障數(shù)據(jù)流通,。亞馬遜云科技在2022年推出了一項全新的數(shù)據(jù)管理服務(wù)Amazon DataZone,,可以讓客戶更快、更輕松地對存儲在亞馬遜云科技,、客戶本地和第三方來源的數(shù)據(jù)進行編目,、發(fā)現(xiàn)、共享和治理,。借助Amazon DataZone,,管理員和數(shù)據(jù)資產(chǎn)管理者可以使用精細的控制工具管理和治理數(shù)據(jù)訪問權(quán)限,確保數(shù)據(jù)訪問發(fā)生在正確的權(quán)限和正確的情境之下,。 開啟生成式AI旅程的建議 談到用戶應(yīng)該如何使用數(shù)據(jù)來開啟自己的生成式AI之旅時,,Matt Wood給出了五條建議: 1、基于自己現(xiàn)有的數(shù)據(jù)戰(zhàn)略去做構(gòu)建,; 2,、在組織內(nèi)實現(xiàn)更廣泛、更安全的生成式AI實驗,; 3,、為需求場景定制化模型; 4、攜手亞馬遜云科技,,探索無限可能,; 5、選擇場景,,即刻啟程,,構(gòu)建未來。 “技術(shù)能力往往遵循S曲線,。你永遠不知道你現(xiàn)在S曲線上的哪個位置,,除非你事后進行回顧。希望明年再會的時候,,我們能夠回顧一下自己在S曲線的頭部有哪些新的點,,另外在未來有哪些展望,我們希望在這個曲線上有漸進的推動,。我們相信明年回顧的時候,,能夠看到我們已經(jīng)到達了S曲線的頂點,達到了快速爆發(fā)式發(fā)展的點,,涌現(xiàn)出許多的創(chuàng)新發(fā)明和應(yīng)用,。”Matt Wood說道,,“科幻作家威廉·吉布森曾經(jīng)說過'未來近在咫尺,,只不過時隱時現(xiàn)’,亞馬遜云科技始終希望將擁有廣闊前景且令人興奮的技術(shù)提供給每個人,。在云計算時代,,我們提供通過API訪問云上應(yīng)用的快捷訪問,這一愿景不會因為生成式AI的出現(xiàn)而改變,,我們希望將這項技術(shù)交到每一個構(gòu)建者和每一個商業(yè)用戶的手中,。” “此次亞馬遜云科技中國峰會,,彰顯了亞馬遜云科技在云與AI領(lǐng)域的持續(xù)深耕,。尤其在近期引起熱議的AIGC領(lǐng)域,亞馬遜云科技更加強調(diào)將自身技術(shù)能力和最佳實踐賦能客戶和合作伙伴的AIGC業(yè)務(wù)發(fā)展,,通過更加靈活敏捷,、低門檻的產(chǎn)品(譬如Amazon Bedrock和Amazon CodeWhisperer),加速AIGC技術(shù)的普及以及在更多行業(yè)場景中探索價值,,致力于成為AIGC世界中的'幕后推手’和'數(shù)字基座’,。”艾瑞咨詢研究總監(jiān)王成峰表示,。 生成式AI領(lǐng)域的“百模大戰(zhàn)” 自從ChatGPT一夜爆紅,,市場上相繼出現(xiàn)了各式各樣的生成式AI工具和大模型,,號稱AIGC“百模大戰(zhàn)”,這也讓許多用戶不知道如何選擇,。對此亞馬遜云科技又有著怎樣的看法和建議,? “隨著ChatGPT的橫空出世,很多人都深受鼓舞,,但是也要認真考慮我們究竟需要什么樣的生成式AI工具,需要構(gòu)建什么樣的系統(tǒng),,需要什么樣的資源,,尤其是什么樣的大模型,才能實現(xiàn)自己的構(gòu)想,?!盡att Wood表示,“而亞馬遜云科技的目標,,就是用盡可能簡單的方法,,幫助客戶構(gòu)建自己的大模型。不管是創(chuàng)業(yè)公司,、中小企業(yè)還是大型企業(yè),,都可以運用這些生成式AI工具。我們的開發(fā)人員能夠以難以置信的方式,,來提供簡單易用的生成式AI工具,。不管是文本還是圖像,用戶只需要了解簡單的API和選擇適合的模型,,就可以輸出自己想要的內(nèi)容,。而在這個過程當中,亞馬遜云科技的與眾不同之處,,就是我們提供的生成式AI工具必須是隨處可用的,,并且能夠以極低的成本實現(xiàn),以盡可能低的延遲來向用戶交付服務(wù),,同時確保運維操作的最優(yōu)化,。因此我們選擇了定制芯片的方法,這樣可以提供更加強大的性能,,并且盡可能地降低成本和時延,。” Matt Wood指出,,在亞馬遜云科技看來,,不同行業(yè)用戶的需求千差萬別,因此并不存在一個可以適用多種應(yīng)用環(huán)境的“一招鮮”萬能大語言模型,。為此亞馬遜云科技在努力訓(xùn)練Amazon Titan等自研大語言模型的基礎(chǔ)上,,也在積極使用Anthropic,、AI21Labs、Stability AI等第三方合作伙伴的大語言模型,,讓用戶可以根據(jù)自身的需求,,使用自己的數(shù)據(jù),以各種不同的方式定制相應(yīng)的大語言模型,。 “正是有賴于我們過去一段時間在生成式AI領(lǐng)域的研發(fā)和創(chuàng)新,,我們實現(xiàn)了低成本、低時延,,讓客戶擁有了能夠通過定制芯片構(gòu)建自己模型,、使用自己模型的能力。目前在整個行業(yè)中,,亞馬遜云科技在所有供應(yīng)商當中實現(xiàn)了以速度最快,、成本最低、最簡單易行的方式,,來提供生成式AI大模型,。”Matt Wood表示,,“與此同時,,我們還在不斷地推出新的服務(wù),例如使用生成式AI產(chǎn)品CodeWhisperer,,來幫助軟件開發(fā)人員極大地提升工作效率,,使其能夠以更快的速度、更高的質(zhì)量,、更安全的方式來編寫軟件和程序,。這一點也讓很多客戶感到非常興奮和滿意?!?/p> |
|