CosyVoice是一个由阿里通义实验室开源的语音生成模型,专注于自然语音生成。它支持多语言、音色和情感控制,能够生成多种语言的自然流畅语音。
Seed-TTS是字节跳动团队推出的新型语音生成模型。该模型基于自回归Transformer架构,能够生成接近人类语音的自然且富有表现力的语音。Seed-TTS支持语音内容和说话速度的编辑,用户可以灵活调整生成的语音,以适应不同的应用场景。