Voice AI | AIUG

AI音频工具

Voice AI

实时AI变声工具。

链接直达手机查看

Voice.AI 是一款实时的AI语音转换器，也就是我们常说的AI变声器！

它支持记录模式和实时模式两种，

记录模式：可以上传音频进行转换或者录制转变声后的音频（免费版每次仅支持15秒的变声）

实时模式：可用于直播、游戏内变声聊天、聊天软件变声、也可以用于au等录音软件！

Voice.AI

软件内目前可以看到目前有一万五多种声线可以选择，建议大家选择可以试听的，试听后再选择购买。你也可以上传自己的声音，让AI来克隆你的声音。

MooER是摩尔线程公司开发的一款音频理解大模型，是业界首个基于国产全功能GPU进行训练和推理的大型开源语音模型。

EmotiVoice是一款由网易有道开发的开源文本到语音（TTS）引擎，支持中英文双语，并包含超过2000种不同的音色。其最显著的功能是情感合成功能，能够根据文本内容生成具有快乐、兴奋、悲伤、愤怒等多种情感的语音。

Stable Audio Open是一个基于文本的音频生成模型，能够根据简单的文本提示生成长达47秒的高质量音频数据。无论是鼓点、乐器旋律、环境声音还是音效，它都能轻松应对。

VoiceCraft 是一个开源项目，由 Jason Peng 等人开发，旨在实现零样本（Zero-Shot）语音编辑和文本到语音（Text-to-Speech, TTS）转换。

Video-Foley是由韩国高等科学技术院（KAIST）的研究团队开发的一个视频到声音的生成系统，利用深度学习技术，通过分析视频内容自动生成与之同步的声音效果，极大地简化了声音设计的流程。

可以将文本转换为不同格式的语音