开源的AI语音生成社区
Uberduck 功能:开源的AI语音生成社区,5000多种不同的声音,可使用自己的自定义语音克隆进行合成 。
天工SkyMusic是昆仑万维推出的一款AI音乐生成大模型,它是基于昆仑万维的「天工3.0」超级大模型打造。
Whisper是OpenAI开发的一个自动语音识别(ASR)系统。它基于从网络上收集的680,000小时的多语种和多任务监督数据进行训练,具有极高的准确性和适应性。
GroqNotes是一个基于Streamlit的应用程序,它利用Groq的Whisper和Llama3技术,将音频内容快速转换成有组织的笔记。这个项目通过结合Groq的高速处理能力和先进的AI模型,实现了音频到文本的快速转换。
Audiocraft 是一个AI音频和音乐生成工具,该工具声称可以直接从文本描述和参考音乐生成高质量的音频和音乐。
Amphion介绍Amphion是一个用于音频、音乐和语音生成的开源工具包,不论是搞语音识别应用,还是音频编[…]
TextToSpeech 是一款完全免费的在线 AI 文本转语音工具,它允许用户将文本转换成听起来非常自然的高质量语音,并且可以任意下载。