Voice Engine简介
Voice Engine是OpenAI开发的一款音频大模型,主要功能是从15秒的音频样本和文本输入中生成自然且接近原说话者的声音。这项技术已经应用于OpenAI的文本到语音API和ChatGPT的语音功能中。Voice Engine的核心能力在于其能够复制几乎任何人的声音,包括情感丰富的自然语音,显著提升了合成语音的自然度和真实感。
Voice Engine的应用场景非常广泛,包括但不限于帮助失去声音表达能力的人重新获得发声能力、为非言语个体提供支持、生成有声读物以辅助阅读、内容翻译以及改善基本服务交付等。此外,Voice Engine还能够根据用户的需求定制个性化的音色,用于语音翻译、配音等功能。
Voice Engine官网:https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices