

想象一下,一个人粗略地吹奏《夺宝奇兵》的主题曲。然后,再想象一下,电脑听到这个吹奏的版本,并模仿它——但模仿的风格是巴赫,用管风琴演奏。
Facebook 的一个部门的一小群研究人员创造了一个人工智能系统,它能够做到这一点——听取一段歌曲的音频文件,然后用新的乐器模仿它。这就像一个拥有合成大脑的翻唱乐队。他们称之为“通用音乐翻译网络”,它可以根据给定的音乐文件,输出六种不同风格的音乐。
不仅仅是《夺宝奇兵》和巴赫。该系统可以接受一首经典、深情的歌曲,比如《永在我心》,然后将其变成莫扎特演奏的版本。“我们希望模仿人类听音乐并重复的能力,无论是通过吹奏还是演奏乐器,” 描述这项工作的一项新研究 的合著者之一 Lior Wolf 说。人工智能并没有读取乐谱——它只是将给定的音频文件转换为代码,然后将其解码成一个新版本。
“它在内部学习,形成自己的表示,这是[乐谱]的另一种选择,” Wolf 补充道。“最能描述它的方法是,它在不同的音乐领域,以不同的风格,创造[一个]翻唱版本。” 这些风格包括莫扎特、巴赫和贝多芬。研究人员将一首 Metallica 的riff输入系统,得到了一个钢琴版本。
这项研究的另一位合著者 Yaniv Taigman 表示,他们受到了被称为神经风格迁移的计算机视觉技术的成功启发,这种技术是将一幅图像以新的风格重绘,就像梵高画了你的照片一样。(Prisma 应用就是一个很好的例子)。“我们基本上想把同样的效果带到音乐中,音乐被许多人视为一种通用语言,” Taigman 说。
听起来很有趣——看看下面的视频,听听它如何将海顿的弦乐四重奏以莫扎特的风格翻唱,或者将贝多芬的非洲鼓乐段重复成钢琴曲。在不同时刻,它感觉既精致又粗糙:莫扎特翻唱海顿的交响乐比莫扎特翻唱吹奏版的《夺宝奇兵》主题曲要好得多。描述这项研究的论文直白地这样描述:“要求将一种乐器转换为另一种乐器,我们的网络水平与专业音乐人相当或略差。”
这项开发吸引了 Google 的人工智能研究员 Adam Roberts 的注意,他致力于 Magenta 项目,该项目专注于机器学习、艺术和音乐。他 发推文说:“我听过的第一个令人信服的音乐风格转移。一定要听听非洲鼓和吹奏版的交响乐!”
Facebook 已经使用 人工智能来为其语言翻译服务,当您在网站上遇到其他语言的评论时,您会看到这些服务。但在 解释这项新研究的博客文章 中,该公司表示不打算将其用于“特定产品或功能”。研究人员将在 Github 上发布该项目的代码,供任何人使用。
Janelle Shane 在 aiweirdness.com 博客上 (一个名为 aiweirdness.com 的博客),通过神经网路这种人工智能形式进行有趣的实验,她因使用人工智能生成有趣的全新内容而闻名,例如 奇怪的情人节糖果心形留言——她说,如果有一个普通人可以使用该工具来尝试这项功能,它就可以激发创造力。
“我真的希望他们能搭建一个演示平台,让其他人可以玩这个工具,”她说。“似乎有很多艺术家可以从中创作出真正很酷的东西——而现在,普通人使用人工智能工具、使用神经网络工具进行艺术创作、生成音乐的门槛有点太高了。”
