开源的AI语音生成社区
Uberduck 功能:开源的AI语音生成社区,5000多种不同的声音,可使用自己的自定义语音克隆进行合成 。
TextToSpeech 是一款完全免费的在线 AI 文本转语音工具,它允许用户将文本转换成听起来非常自然的高质量语音,并且可以任意下载。
Tango 2是一款新型文本到音频生成模型,它通过直接偏好优化(Direct Preference Optimization, DPO),显著提升了音频输出与输入文本的匹配度。
多语言语音合成、声音克隆、文本和音频处理技术,可以把任意一段音频或者视频,快速翻译为包括中文、葡萄牙语、日语等在内的29种语言,同时保留原语音者的音色特征和情感
FunAudioLLM是一款致力于提升人类与大型语言模型(LLMs)之间自然语音交互的先进模型。它正以前所未有的方式,重塑着人与机器之间的语音交互。
EmotiVoice是一款由网易有道开发的开源文本到语音(TTS)引擎,支持中英文双语,并包含超过2000种不同的音色。其最显著的功能是情感合成功能,能够根据文本内容生成具有快乐、兴奋、悲伤、愤怒等多种情感的语音。
Easy-Voice-Toolkit 是一个功能丰富的开源音频处理项目,它集成了多种音频处理技术,为用户提供一站式的音频解决方案。