上和弦 上和弦匠心設(shè)計(jì)全新校區(qū) Audio Matrix 本文作者:辰諳 隨著最近ChatGPT的爆火,,關(guān)于AI的概念和應(yīng)用再次得到了很大關(guān)注度。其中,,AI作曲便是其中很值得討論的一個(gè)話題,。 目前的AI作曲到了什么水平?音樂人會(huì)失業(yè)嗎,? 01 音符學(xué)習(xí)的AI作曲 目前,,關(guān)于AI作曲的兩種較為流行的思路分別是音符學(xué)習(xí)和音頻學(xué)習(xí)。 音符學(xué)習(xí)指的是用讓AI學(xué)習(xí)大量的樂譜或MIDI文件,,然后使其在這種學(xué)習(xí)的基礎(chǔ)上生成樂譜或MIDI文件,,最后配合上一些特定的音源進(jìn)行輸出。 這種方式做出來的音樂跟我們做MIDI編曲出來的感覺是差不多的,,即帶有一定的“MIDI味”,,簡而言之就是有些塑料有些假。 但是,,目前MIDI技術(shù)和音源的水平都已經(jīng)到了一定的水平并還在持續(xù)進(jìn)步,,能用MIDI做出擬真樂器效果的人也越來越多。將來這一塊可供AI學(xué)習(xí)的資料的質(zhì)量和數(shù)量也會(huì)愈加可觀,。 況且,,一些電子音樂本身也不太需要擬真的樂器效果。 這種思路的另外一個(gè)問題就是,,音樂制作并不是僅僅只有編曲的流程,,混音和母帶同樣也是十分重要的。這兩個(gè)方面的工作是音符學(xué)習(xí)的AI無法勝任的,。 其實(shí),,音符學(xué)習(xí)的AI作曲在很多年前就已經(jīng)有相關(guān)的實(shí)踐了,比如國外的PG MUSIC公司出品的Band in a Box。 這款軟件可以根據(jù)選定的風(fēng)格,、速度,、節(jié)奏等進(jìn)行自動(dòng)編曲。 目前,,國內(nèi)也有不少公司正在做音符學(xué)習(xí)的AI作曲,,比如網(wǎng)易云音樂出品的AI音樂創(chuàng)作工具和靈動(dòng)音科技公司出品的BGM貓等。 其中,,網(wǎng)易云音樂公司出品的這款A(yù)I音樂創(chuàng)作工具主要面向網(wǎng)易云音樂人開放,,在生成時(shí)需要選擇音樂的風(fēng)格、樂器,、調(diào)號(hào),、拍號(hào)、速度以及時(shí)長,。 在生成完成之后,,我們可以下載該音樂的MP3、WAV,、簡易MIDI以及全分軌MIDI,。 老實(shí)說,這款工具生成的音樂的質(zhì)量是真還可以的,,聽得出來是經(jīng)過了MIDI控制器的調(diào)制的,,“MIDI味”也沒有那么重。 不過,,要想把MIDI下載下來,,然后自己在宿主中還原平臺(tái)上呈現(xiàn)出來的渲染完成了的音樂的效果的話,那還是得自己做很多操作,。 畢竟,,據(jù)觀察這個(gè)平臺(tái)生成的MIDI中動(dòng)用了的MIDI控制器只有Modulation一個(gè),不知為何連力度控制器都沒動(dòng),。 02 音頻學(xué)習(xí)的AI作曲 另外一種思路的音頻學(xué)習(xí)則是直接讓AI學(xué)習(xí)一些現(xiàn)成的音頻文件,。 在學(xué)習(xí)到了這些音頻在各種聲音呈現(xiàn)上的指標(biāo)如波形、振幅,、頻率,、泛音列等之后,AI便能生成類似的音頻文件,。 在這種思路下,只要保證AI學(xué)習(xí)的音頻資料的質(zhì)量足夠高,,AI生成的音樂就完全不會(huì)有任何“MIDI味”了,。而且無論是什么風(fēng)格的音樂,哪怕是難度極高的爵士樂對(duì)于AI來說也不存在任何特殊的學(xué)習(xí)門檻。 另外,,這種思路其實(shí)不僅限于音樂的生成,,包括語音、音效等的生成在理論上都可以實(shí)現(xiàn),。 在這一方面,,國外的Riffusion、Dance Diffusion,、AudioLM和Jukebox等產(chǎn)品都做出了一定的成績,。而在目前,做得較為成功的則是谷歌公司的MusicLM,。 其實(shí),,MusicLM的前身AudioLM并不專注于音樂的生成,而是語音的生成,,比如根據(jù)一個(gè)人說的一段話生成模仿其聲線的語音,。 AudioLM的這種語音生成功能已經(jīng)達(dá)到了以假亂真的級(jí)別,你只要跟它說一句話,,就可以從它這里聽到用你的聲音說出來的一段你從來沒說過的話,。 而有了AudioLM的成功經(jīng)驗(yàn)之后,谷歌又在此基礎(chǔ)上推出了MusicLM,。在這款產(chǎn)品中,,我們只要輸入一些描述性的詞語或短語,它就能據(jù)此生成對(duì)應(yīng)的音樂,。 而且,,它還能夠根據(jù)我們哼唱的一段旋律來進(jìn)行完整音樂片段的生成。MusicLM生成的音樂片段基本上都是沒有“MIDI味”的,。 不過,,MusicLM的不足也很明顯,即其學(xué)習(xí)的和生成的音頻文件的采樣率都只有24kHz,,遠(yuǎn)遠(yuǎn)沒達(dá)到我們常聽的CD的44.1kHz的標(biāo)準(zhǔn),。所以,我們往往會(huì)感覺其生成的音頻音質(zhì)不高,。 而之所以把采樣率設(shè)置得這么低,,其實(shí)主要也是算力成本的限制。采樣率越高的音頻需要耗費(fèi)的算力成本就會(huì)越高,。 另外,,在生成的音樂的連貫性上,MusicLM目前的表現(xiàn)仍然不是特別令人滿意,,經(jīng)常會(huì)出現(xiàn)前后樂段割裂感嚴(yán)重的情況,,這其中其實(shí)也有算力的原因,。將來,當(dāng)算力成本降下來之后,,這款產(chǎn)品的效果想必也會(huì)有質(zhì)的提升,。 03 AI會(huì)讓音樂人失業(yè)嗎? 在目前AI能生成的音樂的水平下,,專業(yè)的音樂人還遠(yuǎn)遠(yuǎn)不必?fù)?dān)心失業(yè)的問題,。 其實(shí),AI帶來的最大變革是解放人類的生產(chǎn)力,,讓人類從一些缺少創(chuàng)作性的活動(dòng)中解放出來,。畢竟,即使是音樂行業(yè)也并不全是創(chuàng)造性的活動(dòng),,某些機(jī)械重復(fù)的音樂制作交給AI是最好的選擇,。 而從長遠(yuǎn)的角度來看,AI作曲更宏大的目標(biāo)是探索和開發(fā)人類的音樂智慧,。 相比人類,,AI作曲有著能夠打破思維定式等方面的優(yōu)勢(shì),只要好好利用這些優(yōu)勢(shì),,音樂人也能變得更強(qiáng),。君子生非異也,善假于物也,。 |
|