GPT-SoVITS简介
RVC变声器创始人 (GitHub昵称:RVC-Boss)开源了一款跨语言音色克隆项目 GPT-SoVITS。支持少量语音转换、文本到语音的音色克隆模型,支持中文、英文、日文的语音推理。
据开发者及各大博主测验,仅需提供 5 秒语音样本即可体验达到 80%~95% 像的声音克隆。若提供 1 分钟语音样本可以逼近真人的效果,且训练出高质量的 TTS 模型。
GPT-SoVITS项目地址:https://github.com/RVC-Boss/GPT-SoVITS
GPT-SoVITS特征
• 零样本 TTS:输入 5 秒语音样本并体验即时文本到语音转换。
• Few-shot TTS:仅用 1 分钟的训练数据即可微调模型,以提高语音相似度和真实感。
• 跨语言支持:用与训练数据集不同的语言进行推理,目前支持英语、日语和中文。
• WebUI工具:集成工具包括语音伴奏分离、自动训练集分割、中文ASR和文本标注,帮助初学者创建训练数据集和GPT/SoVITS模型。