索尼推出全能音樂AI工具：作曲混音編曲都OK！留給人類發揮的空間不多了

2022-01-11知識

博雯發自凹非寺
量子位報道 | 公眾號 QbitAI

在AI們還在某個特定領域學畫畫、學寫歌的時候，索尼已經喊了一群AI來給音樂人做全能助手了！

包含從鼓點、貝斯、鋼琴伴奏的生成，到多音軌的混合，再到母帶制作等多項功能的那種。

可以說，創作音樂的全程都有AI的參與。

而這些AI們單拎出來也都是優秀的「唱作人」，自己也可以創作新的旋律、節奏或和聲樣本。

用索尼的話來說，這種AI合成的音樂樣本其實是提供了一種「創意原型」，能夠讓音樂家仿佛在與多名制作人一起頭腦風暴，探討新的音樂創意。

而這全套音樂輔助工具，總共包含了六大創造性AI，和四大專業的音訊制作工具。

這時候，就不得不再喊出那句話：

AI輔助音樂創作

首先是創造性的AI工具，這些工具某種程度上是將「音樂創新」這件事流水線化了。

其中， DrumNet 透過無監督學習的方式從音樂數據集之間生成一種音樂與鼓點之間的期望關系，進而形成一種可以直接基於現有的音樂旋律生成鼓點節奏的AI。

BassNet 則是基於現有音樂旋律生成低音的AI，並且在音樂播放時可以隨時調整和控制產生音符的密度、清晰度和音色。

https://www.zhihu.com/video/1464250607871287296

Flow Machines 可以生成一段包含和弦、低音和完整旋律的音軌樣式。

在把實際演奏的鋼琴旋律進行數碼化處理時，常常會遇到一些音符的缺失，這時就可以用 PIA 進行「修復」，甚至還可以直接去「續寫」或者從頭建立一段新的旋律。

這就相當於讓使用者扮演了藝術總監的角色，只需要驗證或否決AI創造出來的作品是否足夠讓人滿意。

https://www.zhihu.com/video/1464250689018470401

剩下的兩個AI中， NOTONO 可以直接用復制貼上來添加不同的音色，是一個將聲音視覺化的合成器。

而 DrumGAN 則是我們熟悉的GAN，用於生成各種各樣的鼓聲。

接下來是專業性的工具。

Profile EQ 類似擁有「自動對比」功能的圖形編輯器，是一個能將音訊直觀對比的自適應均衡器。

Resonance EQ 則擁有類似「調節影像飽和度」的功能，能對音訊也進行類似的調節：比如平滑音訊，去掉雜音，或放大共鳴，強調諧波豐富旋律。

Multiband Phase 是一個可以自動辨識和修復相位相關問題的工具， XSpecMatch 則是一個即時的音訊匹配均衡器。

AI無法代替藝術創造

其實，這種AI與藝術創作的碰撞在最近幾年愈發頻繁。

比如在去年年初，科研機構Space150模仿說唱歌手Travis Scott的人聲和音樂風格，基於AI技術做出了一個說唱機器人Travis Bott。

而這位Travis Bott真的創作了一首名為【Jack Park Canny Dope Man】的歌，歌詞和旋律均由自己完成。

雖然有不少網友看著MV表示「比真人還好」，「非常有趣，這僅僅是個開始」，表示如果這位歌手開演唱會自己一定會買票去看。

但也有人產生了這樣的擔憂：

仿佛在看【黑鏡】中的一集。

事實上，每當AI在藝術創造領域有了新的套用時，都能引發無數的思考和爭論。

人們在驚嘆AI創作力與日俱增，甚至於人類無異的同時，也在擔心AI是否會進一步蠶食掉創作領域中的藝術家們的工作。

對於這種問題，開發了上述全套AI輔助工具的Sony CSL實驗室是這樣說的：

藝術家不是深度學習的專家，因此，我們要將技術嵌入到藝術家的工作流，讓人工智能更好地輔助他們進行創作。

秉持著這一目標，該實驗室在巴黎的分部Sony CSL Paris已經在理解和創造音樂、語言等多個具有藝術創造力的領域，透過AI和數據科學發表了多篇論文，開發了不少套用。

而一些音樂人也表示，AI在藝術創作領域的高速發展或許會使一些創作者受到挑戰，比如在音樂圈從事重復勞動工作，創作口水歌、套路化背景樂的音樂人。

但是，AI永遠不會替代核心創作者，還會把從業者像更核心、更創意化個人化、更具有藝術價值的方向推動。

參考連結：
https:// cslmusicteam.sony.fr/pr ototypes/

—完—

@量子位 · 追蹤AI技術和產品新動態

深有感觸的朋友，歡迎贊同、關註、分享三連վ'ᴗ' ի ❤