昆仑万维于2025年3月26日发布的全球首款音乐推理大模型 Mureka O1

昆仑万维于2025年3月26日发布的全球首款音乐推理大模型 Mureka O1,标志着AI音乐生成技术的重大突破。该模型基于自研的 MusiCoT 技术,首次将思维链(Chain-of-Thought, CoT)方法引入音乐生成领域,实现了结构化创作与音质的双重提升。以下是其核心亮点与技术解析:


一、技术突破:MusiCoT与CoT方法

  1. 预生成音乐结构
    MusiCoT通过思维链(CoT)方法,在细粒度音频生成前预生成整体音乐结构,显著提升作品的连贯性与乐器编排精准度。传统自回归模型逐帧生成音频,而MusiCoT通过全局规划优化了旋律动机、配器丰富度和作曲结构。

  2. 无标注高扩展性
    基于CLAP模型,MusiCoT无需人工标注即可实现跨语言、跨风格的音乐生成,支持10种语言(中、英、日、韩等)的歌词创作与纯音乐生成。


二、功能亮点与应用场景

  1. 多模态创作能力

    • 音色克隆:支持上传用户音色或指定歌手音色,生成个性化歌曲。
    • 歌曲参考:用户可上传音频或YouTube链接作为创作提示,直接复刻风格。
    • 纯音乐生成:输入关键词(如“拉丁风”)即可生成BGM,解决短视频、广告等场景的版权问题。
  2. API开放与商业化
    Mureka是全球首批开放API服务的AI音乐平台,提供标准音乐生成、精调私有曲库、语音播客等API接口,覆盖游戏配乐、影视配乐、品牌定制等场景。


三、性能优势与评测表现

  1. 音质超越Suno V4
    在主观听感评测中,Mureka O1的人声质感(Vocal Texture)、BGM质感(Background Music Texture)和混音(Mixing)显著优于Suno V4;客观指标上,其乐器演奏法多样性、配器设计及生成速度(比Suno快一倍)均领先。

  2. 模型迭代与生态
    Mureka V6作为基座模型,引入自研ICL(上下文学习)技术,优化声场与混音设计;O1模型则通过CoT技术实现专业级创作,支持二次编辑与多轨输出。


四、战略布局与行业影响

  1. 全球化与商业化路径
    昆仑万维凭借多年海外布局与多语言支持,目标覆盖全球90%用户市场。董事长方汉表示,AI音乐将降低创作门槛,推动“自我表达30年”趋势,预计商业化规模将从40亿美金扩展至百亿级。

  2. 技术护城河
    昆仑万维自2020年布局AIGC领域,拥有文本、图像、3D、视频、音乐五大自研模型,天工AI日活用户超100万。Mureka O1的发布巩固了其在AI音乐领域的领先地位。


总结

Mureka O1不仅是技术上的SOTA模型,更通过开放API、音色克隆等功能构建了完整的音乐创作生态。其全球化布局与商业化潜力,预示着AI音乐从工具到产业的全面升级。用户可通过 Mureka官网 体验生成效果,开发者可接入API实现定制化应用。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!