AI作曲到什么水平了？音樂人會(huì)失業(yè)嗎,？

劉溝村圖書館 2023-06-01 發(fā)布于河南

展開全文

上和弦

上和弦匠心設(shè)計(jì)全新校區(qū)

Audio Matrix

本文作者：辰諳

隨著最近ChatGPT的爆火,，關(guān)于AI的概念和應(yīng)用再次得到了很大關(guān)注度。其中,，AI作曲便是其中很值得討論的一個(gè)話題,。

目前的AI作曲到了什么水平？音樂人會(huì)失業(yè)嗎,？

音符學(xué)習(xí)的AI作曲

目前,，關(guān)于AI作曲的兩種較為流行的思路分別是音符學(xué)習(xí)和音頻學(xué)習(xí)。

音符學(xué)習(xí)指的是用讓AI學(xué)習(xí)大量的樂譜或MIDI文件,，然后使其在這種學(xué)習(xí)的基礎(chǔ)上生成樂譜或MIDI文件,，最后配合上一些特定的音源進(jìn)行輸出。

這種方式做出來的音樂跟我們做MIDI編曲出來的感覺是差不多的,，即帶有一定的“MIDI味”,，簡而言之就是有些塑料有些假。

但是,，目前MIDI技術(shù)和音源的水平都已經(jīng)到了一定的水平并還在持續(xù)進(jìn)步,，能用MIDI做出擬真樂器效果的人也越來越多。將來這一塊可供AI學(xué)習(xí)的資料的質(zhì)量和數(shù)量也會(huì)愈加可觀,。

況且,，一些電子音樂本身也不太需要擬真的樂器效果。

這種思路的另外一個(gè)問題就是,，音樂制作并不是僅僅只有編曲的流程,，混音和母帶同樣也是十分重要的。這兩個(gè)方面的工作是音符學(xué)習(xí)的AI無法勝任的,。

其實(shí),，音符學(xué)習(xí)的AI作曲在很多年前就已經(jīng)有相關(guān)的實(shí)踐了，比如國外的PG MUSIC公司出品的Band in a Box。

這款軟件可以根據(jù)選定的風(fēng)格,、速度,、節(jié)奏等進(jìn)行自動(dòng)編曲。

目前,，國內(nèi)也有不少公司正在做音符學(xué)習(xí)的AI作曲,，比如網(wǎng)易云音樂出品的AI音樂創(chuàng)作工具和靈動(dòng)音科技公司出品的BGM貓等。

其中,，網(wǎng)易云音樂公司出品的這款A(yù)I音樂創(chuàng)作工具主要面向網(wǎng)易云音樂人開放,，在生成時(shí)需要選擇音樂的風(fēng)格、樂器,、調(diào)號(hào),、拍號(hào)、速度以及時(shí)長,。

在生成完成之后,，我們可以下載該音樂的MP3、WAV,、簡易MIDI以及全分軌MIDI,。

老實(shí)說，這款工具生成的音樂的質(zhì)量是真還可以的,，聽得出來是經(jīng)過了MIDI控制器的調(diào)制的,，“MIDI味”也沒有那么重。

不過,，要想把MIDI下載下來,，然后自己在宿主中還原平臺(tái)上呈現(xiàn)出來的渲染完成了的音樂的效果的話，那還是得自己做很多操作,。

畢竟,，據(jù)觀察這個(gè)平臺(tái)生成的MIDI中動(dòng)用了的MIDI控制器只有Modulation一個(gè)，不知為何連力度控制器都沒動(dòng),。

音頻學(xué)習(xí)的AI作曲

另外一種思路的音頻學(xué)習(xí)則是直接讓AI學(xué)習(xí)一些現(xiàn)成的音頻文件,。

在學(xué)習(xí)到了這些音頻在各種聲音呈現(xiàn)上的指標(biāo)如波形、振幅,、頻率,、泛音列等之后，AI便能生成類似的音頻文件,。

在這種思路下，只要保證AI學(xué)習(xí)的音頻資料的質(zhì)量足夠高,，AI生成的音樂就完全不會(huì)有任何“MIDI味”了,。而且無論是什么風(fēng)格的音樂，哪怕是難度極高的爵士樂對(duì)于AI來說也不存在任何特殊的學(xué)習(xí)門檻。

另外,，這種思路其實(shí)不僅限于音樂的生成,，包括語音、音效等的生成在理論上都可以實(shí)現(xiàn),。

在這一方面,，國外的Riffusion、Dance Diffusion,、AudioLM和Jukebox等產(chǎn)品都做出了一定的成績,。而在目前，做得較為成功的則是谷歌公司的MusicLM,。

其實(shí),，MusicLM的前身AudioLM并不專注于音樂的生成，而是語音的生成,，比如根據(jù)一個(gè)人說的一段話生成模仿其聲線的語音,。

AudioLM的這種語音生成功能已經(jīng)達(dá)到了以假亂真的級(jí)別，你只要跟它說一句話,，就可以從它這里聽到用你的聲音說出來的一段你從來沒說過的話,。

而有了AudioLM的成功經(jīng)驗(yàn)之后，谷歌又在此基礎(chǔ)上推出了MusicLM,。在這款產(chǎn)品中,，我們只要輸入一些描述性的詞語或短語，它就能據(jù)此生成對(duì)應(yīng)的音樂,。

而且,，它還能夠根據(jù)我們哼唱的一段旋律來進(jìn)行完整音樂片段的生成。MusicLM生成的音樂片段基本上都是沒有“MIDI味”的,。

不過,，MusicLM的不足也很明顯，即其學(xué)習(xí)的和生成的音頻文件的采樣率都只有24kHz,，遠(yuǎn)遠(yuǎn)沒達(dá)到我們常聽的CD的44.1kHz的標(biāo)準(zhǔn),。所以，我們往往會(huì)感覺其生成的音頻音質(zhì)不高,。

而之所以把采樣率設(shè)置得這么低,，其實(shí)主要也是算力成本的限制。采樣率越高的音頻需要耗費(fèi)的算力成本就會(huì)越高,。

另外,，在生成的音樂的連貫性上，MusicLM目前的表現(xiàn)仍然不是特別令人滿意,，經(jīng)常會(huì)出現(xiàn)前后樂段割裂感嚴(yán)重的情況,，這其中其實(shí)也有算力的原因,。將來，當(dāng)算力成本降下來之后,，這款產(chǎn)品的效果想必也會(huì)有質(zhì)的提升,。

AI會(huì)讓音樂人失業(yè)嗎？

在目前AI能生成的音樂的水平下,，專業(yè)的音樂人還遠(yuǎn)遠(yuǎn)不必?fù)?dān)心失業(yè)的問題,。

其實(shí)，AI帶來的最大變革是解放人類的生產(chǎn)力,，讓人類從一些缺少創(chuàng)作性的活動(dòng)中解放出來,。畢竟，即使是音樂行業(yè)也并不全是創(chuàng)造性的活動(dòng),，某些機(jī)械重復(fù)的音樂制作交給AI是最好的選擇,。

而從長遠(yuǎn)的角度來看，AI作曲更宏大的目標(biāo)是探索和開發(fā)人類的音樂智慧,。

相比人類,，AI作曲有著能夠打破思維定式等方面的優(yōu)勢(shì)，只要好好利用這些優(yōu)勢(shì),，音樂人也能變得更強(qiáng),。君子生非異也，善假于物也,。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn),。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息，謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：劉溝村圖書館 > 《作曲》

舉報(bào)/認(rèn)領(lǐng)