实时AI变声工具。
Voice.AI 是一款实时的AI语音转换器,也就是我们常说的AI变声器!
它支持记录模式和实时模式两种,
记录模式:可以上传音频进行转换或者录制转变声后的音频(免费版每次仅支持15秒的变声)
实时模式:可用于直播、游戏内变声聊天、聊天软件变声、也可以用于au等录音软件!
Voice.AI
软件内目前可以看到目前有一万五多种声线可以选择,建议大家选择可以试听的,试听后再选择购买。你也可以上传自己的声音,让AI来克隆你的声音。
MooER是摩尔线程公司开发的一款音频理解大模型,是业界首个基于国产全功能GPU进行训练和推理的大型开源语音模型。
EmotiVoice是一款由网易有道开发的开源文本到语音(TTS)引擎,支持中英文双语,并包含超过2000种不同的音色。其最显著的功能是情感合成功能,能够根据文本内容生成具有快乐、兴奋、悲伤、愤怒等多种情感的语音。
Stable Audio Open是一个基于文本的音频生成模型,能够根据简单的文本提示生成长达47秒的高质量音频数据。无论是鼓点、乐器旋律、环境声音还是音效,它都能轻松应对。
VoiceCraft 是一个开源项目,由 Jason Peng 等人开发,旨在实现零样本(Zero-Shot)语音编辑和文本到语音(Text-to-Speech, TTS)转换。
Video-Foley是由韩国高等科学技术院(KAIST)的研究团队开发的一个视频到声音的生成系统,利用深度学习技术,通过分析视频内容自动生成与之同步的声音效果,极大地简化了声音设计的流程。
可以将文本转换为不同格式的语音