

Google 使用被称为神经网络的通用人工智能工具来完成各种任务,从在你的 Gmail 帐户中建议文本,到每次你打开 YouTube 应用时为你提供源源不断的推荐视频。现在,Google 已指派一个定制的神经网络来组织和同步 Billie Eilish 的歌曲“Bad Guy”的 150,000 多个 YouTube 翻唱版本。
如果不考虑项目的规模,这听起来并不是一项多么令人印象深刻的任务。当你访问 billie.wityoutube.com 时,“Bad Guy”的原版视频就会开始播放。但从那里开始,你可以点击播放器旁边的相关视频,或者屏幕底部滚动的任何标签。一旦你这样做,视频就会无缝地切换到一个完美同步了速度和音调的翻唱版本。它适用于电脑、智能手机和平板电脑上所有主要浏览器的最新版本。
类别范围从“原声”和“合唱”等典型的翻唱流派,到“手风琴”甚至一种名为“猫风琴”的利基类别。我四处点击了 10 分钟,惊讶于有这么多不同的版本,以及它们之间的过渡是多么无缝。
该应用程序是使用 Google 的开源机器学习软件库 TensorFlow 构建的。“Bad Guy”这首歌之所以适合分析,是因为它拥有一个强劲而简单的节拍,主要基于底鼓的四分音符。几乎不断的“咚咚咚”声为对齐速度提供了坚实的基础。
算法并非每次都能完美运行。它提取内容池的深度可能导致一些奇怪的情况。例如,有时算法会在乐句之间稍微迷失方向,因为从结构上看,乐句听起来很相似。
Google 还表示,它没有对视频之间的音量进行标准化处理,因此你可能会发现有些视频比前一个视频更安静或更响亮。
Google 表示,如果你想坐下来观看所有可能的视频迭代,需要花费 1.46 x 10^100 年,或者近 15 亿万亿年,这比你的感恩节假期要长得多。
如果你有一个你想包含在混搭中的“Bad Guy”翻唱版本,你可以使用 YouTube 的 “管理你的视频”页面 来选择加入。
该项目是 Google AI Experiments 项目的一部分,如果你有空闲时间,值得探索一下。
它还包括其他很酷的项目,例如“Quick, Draw!”。这是一款游戏,你在游戏中尝试绘制物体,然后由一个神经网络来猜测它们是什么。它提取自“世界上最大的涂鸦数据集”,其中包括 5000 多万张用于教算法识别粗糙涂鸦对象的图画。
还有其他与音乐相关的挑战,包括今年的早些时候推出的 Freddie Meter,该挑战要求参与者像已故 Queen 主唱一样唱歌,并根据准确度给出得分。
2018 年,Google 推出了一个名为 Semi-Conductor 的音乐 AI 项目,该项目使用你的电脑摄像头来追踪你的动作,并用它们来指挥虚拟管弦乐队,而你看起来会非常滑稽。幸运的是,AI 不会评判。