AI语音生成

CosyVoice是一个由阿里通义实验室开源的语音生成模型，专注于自然语音生成。它支持多语言、音色和情感控制，能够生成多种语言的自然流畅语音。

Seed-TTS是字节跳动团队推出的新型语音生成模型。该模型基于自回归Transformer架构，能够生成接近人类语音的自然且富有表现力的语音。Seed-TTS支持语音内容和说话速度的编辑，用户可以灵活调整生成的语音，以适应不同的应用场景。