AI音频生成

EzAudio是一个由腾讯AI实验室和约翰霍普金斯大学联合开发的文本到音频（T2A）生成模型。

Audiobox 是一款Meta推出的AI声音生成模型，Audiobox是基于Meta推出的Voicebox AI模型，能生成各种环境音、自然对话语音能够同时接收语音及文字输入，并整合了音频生成和编辑能力，用户可同时使用语音及文字描述，让这款模型生成所需的音频。