为什么 Spotify 的音乐推荐总是如此精准

Spotify 知道你喜欢听什么,并且不害怕告诉你。
spotify on iphone
Spotify 到底有多了解你?Imtiyaz Ali / Unsplash

又到了一年一度的时刻。在 12 月的第一天,大家纷纷打开音乐流媒体应用 Spotify 的“年度总结”列表。你关注的每个人似乎都在截图分享他们最喜欢的歌手和歌曲,并在社交媒体上广泛传播,提供了一份精简的年度听歌历史。 

今年,Spotify 对你 2021 年歌单的个性化总结包括你播放次数最多的歌手、歌曲、流派,甚至还有一个只需点击即可进入的互动故事中的 音乐情绪板。你现在还可以将自己一年的音乐与朋友的音乐“融合”成一个合并的播放列表。(情绪板和融合播放列表是今年的新功能。) 

这一切都引出了一个问题:展示用户如何消费音乐背后的想法是什么?线索可能在于 Spotify 研究团队在去年 5 月 发表的一项研究。研究人员向 10 位用户展示了他们基于 Spotify 账户的个人数据档案,其中包含有关他们最喜欢的歌曲(过去一个月和有史以来)、最喜欢的流派、创建的播放列表数量以及收听 Spotify 的时间等信息。他们发现,展示用户的个人收听历史数据实际上让他们能够“反思自己作为听众的身份”,并让他们看到自己是否只在工作时听音乐,或者是否曾对某个特定歌手有过强烈的迷恋时期。

我们关心这类见解,即使直觉上我们知道这仅仅是音乐,而且我们都知道我们不是泰勒·斯威夫特或洛德的唯一粉丝。可能是因为围绕塑造你一年的歌曲所创造的叙事(现在还带有情感起伏的暗示)总是让人感觉有点个人化,有时甚至会暴露一些信息。(如果你愿意,可以 让外部 AI 来评价你的 Spotify。)FiveThirtyEight 的一位作家曾感慨,Spotify 似乎比他自己更了解他。 

那么,Spotify 到底是如何做到的?我们知道他们收集了海量的数据(最近统计有 3.81 亿月活跃用户)。以下是他们在幕后进行的分析,以了解用户喜欢听什么。

从音乐库到音乐发现

Spotify 创立于 2006 年,最初的愿景是成为一个音乐库。个性化是后来才出现的,当时该应用的工程师们意识到,让人们发现可能喜欢的新音乐可以提升他们的体验。而这可以通过向算法提供有关用户收听历史、音乐选择、特定歌曲的播放时长以及他们对推荐的反应(他们是否喜欢、跳过、重播、保存)等信息来实现

Spotify 的个性化副总裁 Oskar Stål 在 2021 年 10 月的博客文章中表示:“对于那些没有时间或知识为每次晚宴或公路旅行创建无数独特播放列表的听众来说,个性化是一种赋能体验。它从更广泛的层面开启了发现,让每个人每年能发现数百位新歌手。” 

[相关:从 Apple 到 Adele:随机播放歌曲的简史]

他们进行此类个性化处理的方法主要基于两个研究领域:用户建模和精细的声学分析。Spotify 试图通过找出将应用内活动映射到人类特质和情感的方法,并将音乐体验与情绪和情境相关联(如一天、一周或一季中的时间)来模拟用户在应用中的行为。了解这一点可以让他们在周五晚上与周二下午推荐不同的内容。推荐播放列表会出现在主屏幕的轮播图中;还有像 Discover Weekly、Daily Mix 和 Radio 这样的个性化播放列表。 

此外,一个名为“enhance”的新功能允许你在已创建的播放列表中获取推荐。就在本周,Stål 在视频演示中表示,Spotify 的团队正在考虑一种方法,结合人类编辑和机器学习算法来创造音频体验,也许可以将歌曲与播客等内容混合搭配。Spotify 甚至一直在测试一个名为 CoSeRNN 的神经网络,该网络会根据过去的收听历史和当前情境等特定特征来推荐适合当下情境的歌曲。 

至于测试音乐是否反映某些人类特征,他们去年 12 月发布了一项小型基于调查的研究,以了解音乐偏好与某些性格特质的匹配程度。在博客文章中,研究人员指出,性格与音乐流派偏好之间似乎存在一些相关性。毫不奇怪,“乐于接受新事物”的人更喜欢 Discover Weekly;外向的人更喜欢其他人创建的播放列表,而内向的人则更喜欢深入挖掘新发现歌手的唱片。 

深入挖掘你完美播放列表的构成

Spotify 的团队似乎一直在思考新的方式来为用户排序和推荐不同类型的音乐。为此,他们首先需要收集各种数据并构建模型,这些模型可以分析、比较、对比、排序和分组他们获得的多样化信息。该公司研究人员在 2016 年的一篇论文中指出,他们会扫描网络以获取歌手信息和在线评论中用于描述特定歌曲的词语。他们构建算法,可以通过分析平台上数十亿的用户生成播放列表来剖析歌曲的声学结构并分析歌曲之间的关系。此外,他们通过分析用户的历史和实时收听模式来估算给定用户的音乐品味。 

例如,Discover Weekly 是基于对用户最近收听歌曲的仔细分析以及对所有可能包含这些歌曲或类似歌曲的播放列表的扫描而驱动的。Spotify 使用一种名为近似最近邻搜索算法的机器学习工具,根据共享的属性或特征将歌曲和用户分组。

[相关:谷歌的这项新 AI 工具可能会改变我们的在线搜索方式]

Stål 在一篇博文中解释道:“想象一下,你和另一个人有四位相同的最喜欢的歌手,但你们的第五位歌手不同。我们会将这两个接近的匹配项取出,然后想,‘嗯,也许每个人都会喜欢对方的第五位歌手’,并进行推荐。现在想象一下这个过程在大规模上发生——不仅仅是一对一,而是成千上万、数百万的连接和偏好被瞬间考虑。”

Spotify 本身在这方面做了大量数学工作,将歌曲分解为其单独的乐器层,分析其节奏和结构。11 月,该音乐服务公司发布了一项研究,提出了一种名为 MUSIG 的新型个性化推荐模型,该模型基于歌曲的个体特征(如流派、声学、可舞性、歌词的字数)以及它们之间的关系(如它们是否出现在同一个播放列表中),从而学习“有意义的音轨和用户表示”。 

跟上用户

然而,仅仅找出用户此刻喜欢什么是不够的。我们的音乐品味会随着时间而改变,Spotify 必须不断向用户推送他们喜欢的新曲目,以留住他们。 

这包括推荐内容组合,其中包含流行或与用户之前听过的内容相似的音乐,以及更具探索性、与用户通常的参与度不太一致的内容。

[相关:麻省理工学院的科学家教会机器人互相破坏]

Stål 在视频演示中说:“也许你加入 Spotify 是为了听舞曲,但我们能否帮助你在学习时集中注意力?通过平衡这些两极,我们能否帮助你获得更令人满意的内容饮食?我们必须考虑你的期望,那些会让你保持在舒适区的东西,以及你的需求,那些可能会在你未来提升你的收听体验,但可能与你现在期望的完全不同。”

Spotify 的研究人员在 3 月份的一篇文章中写道,这种公式“可以通过帮助用户发现新内容或培养新口味来促进探索。它可以帮助平台将消费分散到不同的歌手,并促进对不太受欢迎内容的消费。”

当然,Spotify 自己也有经济上的原因希望让用户的口味多样化。内部研究表明,具有更多样化收听习惯的活跃用户比音乐消费多样性较低的用户“转化成 Premium 的可能性高出 25 个百分点”。 

为了跟上我们不断变化的需求,并保持推荐的新鲜度,Spotify 还必须能够理解我们喜欢的音乐如何随着时间的推移而演变。今年早些时候,那里的研究人员基于 2016 年至 2020 年持续活跃的 10 万名 Spotify 用户的数据集构建了一个模型。他们查看了每个用户的全部流媒体历史记录,将他们的音乐分为“微流派”,并按时间进行映射。他们得出的结果是一个连接图,说明了不同音乐流派之间的过渡。例如,他们的模型表明,从喜欢“EDM”到喜欢“nu jazz”或“gospel”,用户很可能需要经历一个喜欢“tropical house”(一种舒缓但 upbeat 的电子音乐)的阶段。 

利用这个模型中的路径,Spotify 希望通过引导用户经历他们已经喜欢和他们还不知道的微流派之间的过渡,来逐步让他们适应不同的流派。 

在音乐之外,Spotify 十多年的个性化研究已经扩展到播客。Stål 在公司博客文章中指出:“事实证明,我们甚至可以根据用户对音乐的品味来预测他们可能喜欢哪些类型的播客。”但 Spotify 的音频扩张计划并未止步于此——它最近收购了有声读物公司 Findaway。

 

更多优惠、评测和购买指南

 
Charlotte Hu Avatar

Charlotte Hu

助理科技编辑

Charlotte 是《趣味科学》的助理科技编辑。她对了解我们与技术的关系如何变化以及我们如何在网上生活感兴趣。


© .