一水 闻乐 发自 凹非寺量子位 | 公众号 QbitAI中国AI音乐悄悄把全球第一拿走了——昆仑万维Mureka V8最新登顶Artificial Analysis音乐模型榜一举超越Suno V4.5、Udio v1.5 Allegro等国际主流模型。而且还是人声vocal、器乐instrument双料第一那种。那么问题来了这个新鲜出炉的“双料第一”到底有多能打咱直接实测说话。人声、器乐双实测先看最直观的人声。这块儿我们先给出了一个极简提示词不加复杂的结构和参数就看Mureka V8最原始的理解和生成能力晚风民谣温柔女声黄昏乡间的慢时光。怎么说AI唱歌是不是太有真人感了吐字清晰咱就不提了关键在细节。第四句开头能听到一个明显的换气声再往后几处歌词结尾也明显能听出气息的上扬or下落处理。这种呼吸起伏恰到好处地在曲子里穿插衔接非常自然而不是那种生硬堆砌。还有温柔这个标签不只是贴在声音上在段落的推进上也贯穿始终。主歌更克制、更贴耳、气息更轻副歌才稍微把声带打开情绪抬起来不过这种情绪依然是收着的没有用力过猛。木吉他带入人声一出田间、黄昏、晚风……这惬意感简直扑面而来。听完民谣我们又甩给Mureka V8一个极其刁钻的指令。“曲风要Pop Rock和RB混着来节奏要卡死在72BPM的慢板人声还得在几个段落里来回切换第一段气声唱法是那种沙沙的、带点破碎感的声音副歌直接切摇滚嗓带嘶吼的那种间奏再来一段RB转音最后用假声慢慢收尾。”没想到这反复横跳的刁钻需求还真被Mureka V8给跑出来了听上去完成得不错doge。几种状态截然不同的丝滑转声中间切换还不断档、不卡顿。好吧我承认V8你的唱商在我之上……再让AI试试玩乐器。一提到乐器英式摇滚乐队The Kinks的《You Really Got Me》简直不要太出名——这首歌的前奏是一段1960年代最具标志性的失真吉他riff。所谓riff就是一段简短、重复、极具辨识度的乐器乐句通常是吉他或贝斯演奏构成整首歌的记忆点。而Mureka V8在学到这种技巧后为我们生成了一首纯器乐演奏曲《Got Me Going》就问有谁不想边听边摇头抖腿呢笑.jpg。开头的riff味道非常正一下子就把记忆点拉满然后整个器乐编排也十分有画面感——一听就知道人已经坐在酒馆或Livehouse台下了而此时台上正有一支帅气逼人的乐队在演奏还是边演边跳舞那种。u1s1AI生成的器乐演奏如今能到这个水平确实给了人很大惊喜。听完之后你会很明显感受到它对不同乐器特性、歌曲意境的理解等都往前迈出了一大步。而当这种器乐演奏能力和人声能力相结合之后Mureka V8曾被反复提及的一点也愈发清晰——它所生成的已经不再是一段“AI音频片段”而是一首结构完整、情感连贯、制作精良的“歌”。换句话说它知道什么时候该唱、情绪怎么推进、用什么乐器以及该怎么用。这种近乎专业音乐人的创作能力让它真正跨越了一条从“可生成”到“可直接发布”的线。因为懂音乐所以可以直接生成“歌”。而能够生成一首完整的“歌”则意味着普通人无需专业训练也能拥有属于自己的作品——人人都能参与创作发表的时代真的来了。至此靠着“双料第一”实力打底的Mureka V8也把AI音乐直接卷到了新的高度。三个月一更昆仑万维太卷了不过实测一圈下来我就想知道它这股子暴力进化感是咋做到的答案大概藏在那条密密麻麻的时间线里——昆仑万维这家公司在AI音乐的赛道上简直卷疯了。2024年2月SkyMusic 1.0内测起步到了2026年1月Mureka V8正式发布满打满算不到两年时间硬生生迭代了8个大版本。什么概念平均三个月一更能这么玩到底是在烧钱还是真憋着一口气要把这事儿干成从结果来看昆仑万维应该是后者。回看Mureka这不到两年的进化史其实就是一个把“AI音乐好听”从玄学变成可量化、可复现的工业化生产能力的迭代过程。第一阶段是从不能用到能用。SkyMusic 1.0当时还只是个能跑通的内测版本那时候团队就盯着一件事先把端到端“能用”这件事做出来跑通训练到评测的基础闭环。紧接着两个月后2.0版本就直接把中英文版本上线到天工这时候的AI音乐勉强算是迈过了“能出声、不鬼畜”的门槛。第二阶段是从能用到好用。到了2024年8月产品迎来3.0到4.0大版本跃迁解决了规模化的问题。昆仑万维这次不仅落地了Mureka首个超大规模版本构建起稳定的规模化基模能力还在听感和音质方面还实现了“肉耳可听”的级数跃迁。独立产品也借此杀出重围正式切入市场。到了5.0/5.5版本多语种工程化能力补齐Mureka开始在全球市场刷脸。进入2025年随着MusiCoT和更系统化的强化学习跑成闭环模型开始具备主动思考的能力。这时候的Mureka就不是盲目撞大运了拥有了先规划音乐框架、敲定配器细节和情绪再按逻辑推进创作的主动能力。第三阶段是从好用到直接生产可发布内容。到了V8量变终于引起了质变。人声的呼吸感、乐器的空间感、混音的专业度让它在AA榜单双料登顶直接干翻了Suno和Udio。这一步跨了两年但昆仑万维是真跨过去了。所以那套看似“超速”的迭代节奏好像也没那么“疯”了——不这么卷怎么在两年内把一个从零开始的模型做到全球第一说它卷它还真没完V8发布刚刚过去两个月基于MusiCoT进一步深化的Mureka V9就要来了……Mureka V8解决了AI音乐“能写出来”这件事至于V9卷成了什么样嘛——咱只能说它琢磨的是“能按你想的方式写出来”。不懂3月27日看发布会估计你就懂了。AI音乐这下得看北京了当然了即使不谈Mureka V9仅从V8的两次登顶我们也已经能看到一个更清晰的变化“东升西落”正在AI音乐这个垂类赛道上演。之所以这样说是因为过去很长一段时间AI音乐基本是太平洋那头的主场出名的模型也就那几家。包括这次提到的Suno、Udio等基本有一个算一个。但是现在以昆仑万维Mureka V8为代表的国产模型却悄然间拿回了主动权。说到这里有人或许就好奇了为什么会出现这种反转答案其实早就已经浮出水面了。一旦把这件事放在一个更大的背景下来看你会发现“东升西落”几乎已经成了各个AI赛道必然会出现的一幕景象。从引爆这轮AI革命的大语言模型到最近掀起热潮的“龙虾”剧本基本都一样——前期由海外公司完成技术引爆后期则由国产团队实现追赶甚至反超。到现在国产开源已经成了比肩闭源的重要力量、国产模型被海外公司“友好借鉴”拿去玩“龙虾”……人们总是后知后觉发现很多原本以为的“追赶”其实早就变了。而这一切背后的逻辑其实大家也都心知肚明。放在制造业领域大家会说这是因为有“中国制造”而放在互联网科技、放在AI领域答案则是“中国速度”“中国规模”“中国场景”。一方面国内这批AI玩家基本都经历过互联网从诞生到发展的完整时期所以他们很熟悉那套“小步快跑、不断根据用户反馈进行迭代”的打法。可以说相比从0到1我们尤为擅长从1到100。另一方面在内容、场景和用户规模上国内也拥有得天独厚的“练兵场”——无论是庞大的互联网用户群体、丰富多元的应用场景还是足够复杂的内容生态都给国产模型提供了快速试错、持续优化的土壤。相应地国产AI也能更快形成“飞轮效应”。而这些也同样正在支撑着AI音乐赛道的发展。所以此时国产玩家里有人能“站出来、站起来”也就不足为奇了。至于为什么会是昆仑万维上一部分也已经说了很多了——围绕把“好听”变成可复现的系统能力这个目标他们对AI音乐这个垂类赛道进行了长期持续投入。俗话说水滴石穿、绳锯木断。所以如今能有这个结果也算是水到渠成的事情。再加上昆仑万维还是北京市人工智能产业的科技创新代表所以登顶这件事本身也多了另一层象征意义AI音乐往后高地就是北京了。据说昆仑万维还会在3.27本周五举办的中关村论坛开专场发布会。届时Mureka V9应该会有更多详情和介绍。酷体验地址国内版https://www.mureka.cn/海外版https://www.mureka.ai/榜单地址人声https://artificialanalysis.ai/music/leaderboard/vocals器乐https://artificialanalysis.ai/music/leaderboard/instrumental