2022-11-21 10:32

AI绘画火得,AI唱歌火不得?

1.2万
同样是AIGC,有些人正在用AI源源不断地生成梗图,有些人则用AI生成音乐;同样是AIGC生成音乐,有些在模仿人类,有些在复刻经典。AIGC是个工具,在不同人的手里产生不同的价值,这个数字可能高达数万亿美元。[1]

作者:干麻鸭 编辑:一萌

来源:果壳硬科技

图片来源:由无界版图 AI 工具生成。


在AIGC面前,还有谁不跪下


临近2022年尾声,AIGC成为今年最受关注的技术关键词之一。只需要几句描述,就能让AI进行联想并作画,通过最直接、最快速的视觉反馈,给人类对艺术的常规理解带来冲击。

属于比较不怎么样的AI绘画

通过上一篇文章《AI厂工什么时候开始赛博搬砖?》,你大概已经知道了AIGC是什么以及投资现状。如果展望一下未来,作为Gartner口中的“2022年五大影响力技术之一”,到2025年,AIGC所创造的数据可占到所有已生产数据的10%。[2]

Gartner发布的2022年技术成熟度曲线[3]

虽然目前AIGC在视觉上的竞争更加充分、发展更快,也更吸引眼球,但是音乐作为人类文化与情感的重要载体,AI其实也在对该产业进行改造——只是更加潜移默化。

标签、算法、神经语言识别等功能,几乎成为音乐类App的标配,它们可以自动生成歌单并推送给用户。现在你打开QQ音乐,应该有不少人把选择权直接丢给了“每日30首”和“个性推荐”。

如果谁想体验一下音乐品位被嘲笑的感觉,那AI也可以提供贴心服务。2020年底,网络杂志《The Pudding》推出了一款人工智能应用“How Bad Is Your Spotify?”[4],该应用的数据库里输入了数以百万计的Pitchfork评论、reddit帖子和唱片店推荐,通过分析用户的Spotify播放列表,在嘲笑其音乐品位过于“初级”,或痴迷某个歌手“到了令人不舒服的程度“,热情的Twitter用户甚至曾一度挤爆了Pudding网站。

AI对音乐的改造没有止步于兴趣分析或者品位鉴赏。2014年播出的美剧《天蝎计划》(Scorpion,S2E8)中,讲了一个在当时颇为科幻的故事:一名博客音乐家写出了可以不断制造“神曲”的程序,却因此招来杀身之祸——凶手正是另一个运用程序写歌谋利的创作者。

8年过去, 在大平台们的努力下,《天蝎计划》中的幻想很快成了现实。AI终于打算真实地对音乐创作过程下手了!


他们都在玩AIGC,他们都有美好的未来


2016年6月,世界上第一首人工智能创作出的90秒钢琴音乐作品诞生,它来自谷歌与加州艺术学院联合推出的“Magenta”项目。

此后,AIGC音乐越来越多,底层技术则分为两条路子。

一条路子,是“自动作曲”。2017年,索尼CSL(计算机科学实验室)人工智能程序FlowMachines推出的《老爸的车》(Daddy’s  Car),就是AI作曲的成绩,号称 “第一首完全由人工智能创作的完整歌曲”;微软的AI则通过分析学习几十首圣诞颂歌,推出过一首名为《城市欢乐时光》(Joyful Time in The City)的AI歌曲。

比起90秒作品,完整的AI自动作曲可谓前进了一大步。但它们仍需从人类浩如烟海的历史音乐作品中汲取灵感,是人类艺术灵感的延伸,像《老爸的车》这样的作品,作曲和编曲由AI完成,和声与填词由人类作曲家帮助搞定;《城市欢乐时光》也需要人类辅助完成。其实,这类音乐作品谈不上“完全由人工智能创作”,更多是技术圈地自萌,听众实际接受度得打个问号。

另一条路子,则主打“AI自动合成音乐作品”。比如腾讯音乐阿波罗声音实验室研发的声音合成技术引擎“凌音”, 高度还原和复刻歌手的声音特点,重现艺人经典声音,首位AI歌手发布于今年7月,基于杨超越的声音合成,只需要歌手10分钟左右的录音就能很好地复刻出原声,甚至可以在演唱中带“感情”。此后的成熟作品有《没有寄出的信》(复刻和重现邓丽君的声音),《愿你被这个世界温柔以待》(复刻和重现梅艳芳的声音)。

“自动作曲”与“凌音引擎”的不同之处是,“自动作曲”模仿音乐,“凌音引擎”是使用自主设计的深度神经网络模型,加上既有声音风格元的“合成音乐”,后者并不避讳使用了人类历史上精华艺术作品,并复刻这些艺术风格。

这也是AIGC类音乐的另一个发展方向——与其让机器搞原创音乐,不如让机器辅助人创作音乐,并且比起单纯的输出歌曲,还可以做得更多,改变我们过往体验音乐的方式。

谷歌AI音乐项目Magenta的技术负责人道格拉斯·艾克(Douglas Eck)在接受《科学》杂志(Science)采访时认为,AI已经是国际象棋高手,但如今已成为人类棋艺精进的帮手,音乐也一样,如今不管机器学习速度有多快,人类都能以更快速度适应和利用AI技术来辅助创作,玩出新意[5]。

说得直白点,AI大可不必取代人类,做个趁手的工具也挺好。而最需要AI工具生成内容的,可能不在现实,而在虚拟世界。

也就是,如何把“中之人”彻底数字化。


把AI用到刀刃上


AIGC的音乐进化到今天,已经不同于过往的自动语音合成技术,而是具有更高复刻度,引擎渲染后的AI声音在音色、语气上与真人更加接近,在演唱上也更有表现力和“感情”。目前“凌音”技术不仅能让AI演唱(官方称“合成“)已存在的曲目,用户也可一键定制由AI作词、谱曲、演唱的合成歌曲。

在这种环境下,人们面对的问题是:如何让元宇宙数字人唱跳Rap打篮球?

这并不容易,因为视频世界中不仅需要音乐,还要求具备音乐(乐器/人类)的声音、口型、表情、动作等元素,更丰富的场景下,还需要舞蹈、运镜、灯光……

如果你使用腾讯音乐天琴实验室的“Music XR Maker 系统”,完全可以实现这些需求,而且应用场景多样化,该系统的首位虚拟人小琴于今年10月推出,用AI驱动的方式,基于音乐去生成舞蹈表演和歌唱元素,目的是提升运营效率和虚拟人的真实、趣味性。这也给会议、客服、新闻播报等场景提供了更好的解决方案。据了解,很快也将会有一位从“次世代”远道而来、经过层层遴选的“超级歌手”在TME出道,或许她将颠覆我们对唱歌的想象,成为开辟“音乐虚拟偶像元年”的天降紫微星。

“不同于大投入定制化的头部虚拟偶像,我们希望将Music XR Maker打造成一套高效率、低成本产出数字人的平台,同时让数字人具备更强的实时内容生产能力,让任意音乐、舞蹈、舞台等元素的互动结合成为可能。”QQ音乐技术副总裁周文江谈到。


元宇宙的AIGC音乐也得赚钱啊


2022年,扎克伯格100亿美元烧出来的元宇宙社交平台地平线世界(Horizon Worlds)留存量感人,今年10月16日,Meta内部文件被曝光,其中显示地平线世界的月度活跃用户数量不足20万,远未达到原本50万的预期,且兴趣时长仅仅一个月。

说来好笑,作为一个虚拟世界,元宇宙最缺的却是人,最难的是打造一片好的土壤来吸引人共同创作。

相比较来说,国内另一个元宇宙案例则更为务实,今年7月16日,腾讯音乐旗下的虚拟音乐嘉年华TMELAND联合百事可乐打造了一场沉浸式虚拟3D演出。这场虚拟化音乐演出为元宇宙实验提供了内容和主题,而这次商业合作,也给未来虚拟场景营销提供了“标准模板”。这可能是国内AIGC领域第一个大商业客户买单的案例。诸多品牌主加持到元宇宙的内容共建中,也将丰富生态,形成有一个有生命力的营销场景。

纵观音乐产业,从早期的1.0唱片时代音乐内容的输出集中在少数有资源的专业人士手中;进入到2.0流媒体时代,更多音乐从业者参与进来,推荐和分发机制让他们得到了展示机会;随着3.0的到来, AIGC甚至让音乐消费者也拥有反向输出和参与共创的能力。持续加强对AI的投入,音乐平台的未来或许是一块比想象中更肥沃的土壤。

足够多的高粘性用户、人对音乐永不厌倦的欣赏、已经培养成型的付费习惯、逐步推进的共创工具(不直接介入创作甚至还能够避免版权纷争)、多元化的场景碰撞,谁说音乐平台不是一块比游戏化的元宇宙更佳的土壤呢?

“元宇宙从来都不是一蹴而就的事情,我们可以利用我们已经成熟的技术,去实现一个基础的版本,然后不断的去提升各项技术,去完善元宇宙体验。”针对音乐+AI的更多可能性,天琴实验室计算机视觉负责人董治说到:“我们在AI驱动上的核心能力,它们都有一个共同点,就是通过音乐,用AI的方式,去生成虚拟世界的各项基础元素。“


关于AI艺术的一些后话


从AI写稿,到AI作画,再到AI音乐与视频,AIGC始终面临一些争议:如果生成的内容不够好,那它存在的意义是什么?如果它生成的内容足够好(且这可能是未来的必然),那它会激起新一轮职业替代恐慌吗?人类的精神娱乐生活会被AI接手吗?

这也许是一系列纠缠恒久的话题。技术乐观主义者经常会说,工具的好坏取决于使用者的目的。

实际上,互联网一直在做的,就是让更多人更方便地享受到科技提升带来的乐趣,音乐领域也如是。如果我们在国内把凌音引擎、Music XR Maker等工具开放给所有有需要的音乐人、制作机构或者内容公司,再通过音乐元宇宙和AIGC帮助听众尽快进入到虚实结合的音乐体验中,未来甚至成为全民在音乐领域共创的得力工具,让每个人能按照自己的想象去制作音乐,享受音乐,那也许是个更值得期待的未来。

References:

[1] Generative AI: A Creative New World 2022.9.9 https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/

[2] Predicts 2021: Artificial Intelligence and Its Impact on People and Society  https://www.gartner.com/en/documents/3995104

[3] What’s New in Artificial Intelligence from the 2022 Gartner Hype Cycle https://www.gartner.com/en/articles/what-s-new-in-artificial-intelligence-from-the-2022-gartner-hype-cycle

[4] How Bad Is Your Streaming Music? https://pudding.cool/2020/12/judge-my-spotify/

[5] Science:How Google is making music with artificial intelligence https://www.science.org/content/article/how-google-making-music-artificial-intelligence  doi: 10.1126/science.aan7216

本文链接:https://www.8btc.com/article/6789214
转载请注明文章出处

评论
登录 账号发表你的看法,还没有账号?立即免费 注册
下载
分享
收藏
阅读
评论
点赞
上一篇
下一篇