GPT-SoVITS | AIUG

AI音频工具 AI配音合成（文转音，语音克隆） AI音频工具

GPT-SoVITS

RVC变声器创始人（GitHub昵称：RVC-Boss）开源了一款跨语言音色克隆项目 GPT-SoVITS。支持少量语音转换、文本到语音的音色克隆模型，支持中文、英文、日文的语音推理。

标签：AI声音克隆声音克隆音色克隆

链接直达手机查看

GPT-SoVITS简介

据开发者及各大博主测验，仅需提供 5 秒语音样本即可体验达到 80%~95% 像的声音克隆。若提供 1 分钟语音样本可以逼近真人的效果，且训练出高质量的 TTS 模型。

GPT-SoVITS项目地址：https://github.com/RVC-Boss/GPT-SoVITS

GPT-SoVITS特征

• 零样本 TTS：输入 5 秒语音样本并体验即时文本到语音转换。
• Few-shot TTS：仅用 1 分钟的训练数据即可微调模型，以提高语音相似度和真实感。
• 跨语言支持：用与训练数据集不同的语言进行推理，目前支持英语、日语和中文。
• WebUI工具：集成工具包括语音伴奏分离、自动训练集分割、中文ASR和文本标注，帮助初学者创建训练数据集和GPT/SoVITS模型。