DreamTalk是一个基于扩散的音频驱动的富有表现力的说话头生成框架,可以生成不同说话风格的高质量的说话头视频,它由去噪网络、风格感知的嘴唇专家和风格预测器组成。
RVC变声器创始人 (GitHub昵称:RVC-Boss)开源了一款跨语言音色克隆项目 GPT-SoVITS。支持少量语音转换、文本到语音的音色克隆模型,支持中文、英文、日文的语音推理。
Soundful是一个基于人工智能的AI音乐生成器,可以让你在点击按钮的瞬间,生成适合视频、直播、播客等内容的免版税背景音乐。不仅拥有多种风格和情绪的模板,还可以让你下载高质量的音轨和分轨,以及自定义音乐的参数。
Azure AI TTS是微软开发的生成自然发音的应用和服务。通过自定义真实 AI 语音生成器让你的品牌独具特色,并使用具有不同说话风格和情感语调的语音来搭配你的用例(从文本阅读器和讲述者到客户支持聊天机器人)。
TTSMarker是一个免费的、用户友好的文本转语音工具,可以让用户轻松地将文字转换成语音。用户可以自定义语音的风格、速度、音量和情感,并免费下载音频文件。
Amphion介绍Amphion是一个用于音频、音乐和语音生成的开源工具包,不论是搞语音识别应用,还是音频编[…]
Audiobox 是一款Meta推出的AI声音生成模型,Audiobox是基于Meta推出的Voicebox AI模型,能生成各种环境音、自然对话语音能够同时接收语音及文字输入,并整合了音频生成和编辑能力,用户可同时使用语音及文字描述,让这款模型生成所需的音频。
Lalamu 是一款基于人工智能技术的视频口型同步应用程序。该应用程序由 Lalamu Entertainment 开发,允许用户对视频中的任何面孔进行口型同步。无论是人物、人体模型、书籍封面、艺术品、演员、婴儿、蜡像,甚至银行账单上的面孔,Lalamu 都可以让您在视频中让他们唱歌或说话。
腾讯智影集素材搜集、智能配音、数字人播报、在线剪辑、协作审片等视频生产全链路于一体,引领智能创作新方式。
多语言语音合成、声音克隆、文本和音频处理技术,可以把任意一段音频或者视频,快速翻译为包括中文、葡萄牙语、日语等在内的29种语言,同时保留原语音者的音色特征和情感
输入文字转语音,40多位智能主播ai 配音
语音合成编辑器
Synthesys是受欢迎和强大的AI文本转语音生成器之一,它可以让任何人通过几次点击就能制作专业的AI配音或AI视频。
可以让任何人将文本转换为语音、配音和口述
基于人工智能的语音生成器和文本转语音平台