EzAudio是一个由腾讯AI实验室和约翰霍普金斯大学联合开发的文本到音频(T2A)生成模型。
Audiobox 是一款Meta推出的AI声音生成模型,Audiobox是基于Meta推出的Voicebox AI模型,能生成各种环境音、自然对话语音能够同时接收语音及文字输入,并整合了音频生成和编辑能力,用户可同时使用语音及文字描述,让这款模型生成所需的音频。