MEAD | AIUG

AI数据集 AI数据集机器视觉处理语音识别处理

MEAD

MEAD数据集是一个专注于情感谈话头部视频的大规模、高质量视听数据集。它包含了带有情绪类别和强度注释的高质量谈话头部视频，

链接直达手机查看

MEAD简介

MEAD数据集是一个专注于情感谈话头部视频的大规模、高质量视听数据集。它包含了带有情绪类别和强度注释的高质量谈话头部视频，这些视频展示了60名演员在3个不同强度等级下与8种不同情绪的人进行对话。MEAD被介绍为“A Large-scale Audio-visual Dataset for Emotional Talking-face Generation”，由Loy在其论文中首次提出。这个数据集与以前的数据集不同，它侧重于自然情感语音的面部生成，并考虑了多种情绪状态。

MEAD数据集的特点包括丰富的情感数据、多样化的说话者和多个视角。它不仅满足相同内容不同情绪的需求，还采用时间对齐算法来对齐长度不均匀的语音，以适应不同情绪下的语音速率差异。此外，MEAD数据集支持音频驱动多样化且逼真的面部动画人脸生成，这对于研究人员来说是一个重要的资源。

总的来说，MEAD数据集提供了一个独特的平台，用于探索和开发能够理解和生成自然情感面部表情的技术，特别是在情感谈话头部视频生成方面。通过收集和分析高质量的情感对话视频，MEAD数据集促进了相关领域的研究进展，并为未来的应用奠定了基础。

相关导航

Objaverse数据集

Objaverse是一个大规模的3D对象数据集，旨在解决当前3D数据集规模有限、对象类别多样性不足的问题。

CelebV-Text数据集

CelebV-Text数据集是一个大规模、高质量、多样化的人脸文本-视频数据集，旨在促进人脸文本到视频生成任务的研究。该数据集包含70,000个野外面部视频剪辑，每个视频剪辑都配有20个文本描述。

TMDB 5000 Movie Dataset

TMDB 5000 Movie Dataset 是一个由 Kaggle 平台上的项目 TMDB (The Movie Database) 提供的数据集，包含约4803部电影的信息。

Papers with Code

Papers with Code是一个集合了机器学习论文、代码实现、以及大量数据集的平台。它提供了3000+个机器学习数据集，覆盖了数百个任务和多种语言，旨在促进机器学习领域的研究和发展。

Caltech-256

Caltech-256是一个由加利福尼亚理工学院收集整理的图像物体识别数据集，包含30,607张不同大小的真实世界图像，跨越257个类别（256个对象类别和一个额外的杂波类别）。每个类别至少由80张图像表示，确保了对象识别任务中有足够的样本来进行训练。

HQ-Edit数据集

HQ-Edit 是由加州大学圣克鲁斯分校的研究团队创建的一个高质量、基于指令的图像编辑数据集。