Uberduck | AIUG

AI音频工具

Uberduck

开源的AI语音生成社区

链接直达手机查看

Uberduck
功能:开源的AI语音生成社区，5000多种不同的声音，可使用自己的自定义语音克隆进行合成。

TextToSpeech 是一款完全免费的在线 AI 文本转语音工具，它允许用户将文本转换成听起来非常自然的高质量语音，并且可以任意下载。

Tango 2是一款新型文本到音频生成模型，它通过直接偏好优化（Direct Preference Optimization, DPO），显著提升了音频输出与输入文本的匹配度。

多语言语音合成、声音克隆、文本和音频处理技术，可以把任意一段音频或者视频，快速翻译为包括中文、葡萄牙语、日语等在内的29种语言，同时保留原语音者的音色特征和情感

FunAudioLLM是一款致力于提升人类与大型语言模型（LLMs）之间自然语音交互的先进模型。它正以前所未有的方式，重塑着人与机器之间的语音交互。

EmotiVoice是一款由网易有道开发的开源文本到语音（TTS）引擎，支持中英文双语，并包含超过2000种不同的音色。其最显著的功能是情感合成功能，能够根据文本内容生成具有快乐、兴奋、悲伤、愤怒等多种情感的语音。

Easy-Voice-Toolkit 是一个功能丰富的开源音频处理项目，它集成了多种音频处理技术，为用户提供一站式的音频解决方案。