昆仑万维于2025年3月26日发布的全球首款音乐推理大模型 Mureka O1

AI资讯 7天前硕雀

23 0 0

昆仑万维于2025年3月26日发布的全球首款音乐推理大模型 Mureka O1，标志着AI音乐生成技术的重大突破。该模型基于自研的 MusiCoT 技术，首次将思维链（Chain-of-Thought, CoT）方法引入音乐生成领域，实现了结构化创作与音质的双重提升。以下是其核心亮点与技术解析：

一、技术突破：MusiCoT与CoT方法

预生成音乐结构
MusiCoT通过思维链（CoT）方法，在细粒度音频生成前预生成整体音乐结构，显著提升作品的连贯性与乐器编排精准度。传统自回归模型逐帧生成音频，而MusiCoT通过全局规划优化了旋律动机、配器丰富度和作曲结构。
无标注高扩展性
基于CLAP模型，MusiCoT无需人工标注即可实现跨语言、跨风格的音乐生成，支持10种语言（中、英、日、韩等）的歌词创作与纯音乐生成。

二、功能亮点与应用场景

多模态创作能力
- 音色克隆：支持上传用户音色或指定歌手音色，生成个性化歌曲。
- 歌曲参考：用户可上传音频或YouTube链接作为创作提示，直接复刻风格。
- 纯音乐生成：输入关键词（如“拉丁风”）即可生成BGM，解决短视频、广告等场景的版权问题。
API开放与商业化
Mureka是全球首批开放API服务的AI音乐平台，提供标准音乐生成、精调私有曲库、语音播客等API接口，覆盖游戏配乐、影视配乐、品牌定制等场景。

三、性能优势与评测表现

音质超越Suno V4
在主观听感评测中，Mureka O1的人声质感（Vocal Texture）、BGM质感（Background Music Texture）和混音（Mixing）显著优于Suno V4；客观指标上，其乐器演奏法多样性、配器设计及生成速度（比Suno快一倍）均领先。
模型迭代与生态
Mureka V6作为基座模型，引入自研ICL（上下文学习）技术，优化声场与混音设计；O1模型则通过CoT技术实现专业级创作，支持二次编辑与多轨输出。

四、战略布局与行业影响

全球化与商业化路径
昆仑万维凭借多年海外布局与多语言支持，目标覆盖全球90%用户市场。董事长方汉表示，AI音乐将降低创作门槛，推动“自我表达30年”趋势，预计商业化规模将从40亿美金扩展至百亿级。
技术护城河
昆仑万维自2020年布局AIGC领域，拥有文本、图像、3D、视频、音乐五大自研模型，天工AI日活用户超100万。Mureka O1的发布巩固了其在AI音乐领域的领先地位。

总结

Mureka O1不仅是技术上的SOTA模型，更通过开放API、音色克隆等功能构建了完整的音乐创作生态。其全球化布局与商业化潜力，预示着AI音乐从工具到产业的全面升级。用户可通过 Mureka官网体验生成效果，开发者可接入API实现定制化应用。

Mureka O1

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！

昆仑万维于2025年3月26日发布的全球首款音乐推理大模型 Mureka O1

一、技术突破：MusiCoT与CoT方法

二、功能亮点与应用场景

三、性能优势与评测表现

四、战略布局与行业影响

总结

腾讯开源hunyuan3D 2.0接入Comfy UI

斯坦福大学正式发布《2025 AI Index》报告