當微軟和Google為誰的人工智能聊天機器人更好而使出渾身解數(shù)時,,我們不難發(fā)現(xiàn)這并不是機器學習和語言模型的唯一用途,。除了傳聞中計劃在今年的年度Google I/O活動中展示20多種由人工智能驅(qū)動的產(chǎn)品外,Google正在朝著建立一個支持1000種不同語言的人工智能語言模型的目標邁進,。 在周一發(fā)布的更新中,,Google分享了有關(guān)通用語音模型(USM)的更多信息,,Google稱這一系統(tǒng)是實現(xiàn)其目標的'關(guān)鍵第一步'。 去年11月,,該公司宣布其計劃創(chuàng)建一個支持全球1000種最常用語言的語言模型,,同時還披露了其USM模型。Google將USM描述為'一個最先進的語音模型系列',,它有20億個參數(shù),,在1200萬小時的語音和超過300種語言的280億個句子中進行訓練。 YouTube已經(jīng)使用USM來生成封閉式字幕,,它還支持自動語音識別(ASR),,這可以自動檢測和翻譯語言,包括英語,、中文普通話,、阿姆哈拉語、宿務語,、阿薩姆語等等,。 現(xiàn)在,Google USM支持超過100種語言,,并將作為'基礎(chǔ)'來建立一個更加廣泛的系統(tǒng),。與此同時,Meta公司正在開發(fā)一個類似的人工智能翻譯工具,,但目前仍處于早期階段,。 您可以在Google發(fā)布的研究論文中閱讀更多關(guān)于USM和它如何工作的信息: https:///abs/2303.01037 該技術(shù)的一個目標可能是在增強現(xiàn)實的眼鏡內(nèi),就像Google去年在I/O活動中展示的概念一樣,,能夠檢測并提供實時翻譯,,不過,這項技術(shù)似乎還有點遙遠,,Google在I/O大會期間對阿拉伯語的錯誤表述證明了它是多么容易出錯,。 |
|
來自: 燕山茶社 > 《電腦網(wǎng)絡家電》