HD-VILA-100M数据集是一个大规模、高分辨率和多样化的视频语言数据集,由微软亚洲研究院的研究人员开发。
Emilia数据集是一个大规模、多语言和多样化的语音生成数据集,旨在支持大规模语音生成研究。
CelebA-HQ数据集是CelebA数据集的高质量版本,由30,000张分辨率为1024x1024的人脸图像组成.
CelebA数据集,全称为CelebFaces Attributes Dataset,是由中国香港中文大学多媒体实验室发布的一个大规模人脸属性数据集。
GarDiff是一种创新的虚拟试穿技术,旨在通过生成高保真且细节丰富的试穿图像来提升在线试穿体验。
DressCode数据集是一个用于图像基础虚拟试衣的高分辨率多类别数据集。
CelebV-Text数据集是一个大规模、高质量、多样化的人脸文本-视频数据集,旨在促进人脸文本到视频生成任务的研究。该数据集包含70,000个野外面部视频剪辑,每个视频剪辑都配有20个文本描述。
SA-1B 数据集,全称为Segment Anything 1 Billion,是一个大规模的图像分割数据集,旨在为通用对象分割模型提供训练数据。
DreamBooth数据集是一个用于训练扩散模型以识别和生成特定个体图像的数据集。
Fashion-MNIST数据集是由德国Zalando公司提供的一种服饰物品图像数据集,旨在替代经典的MNIS[…]
DragBench数据集是一个用于评估交互式点基图像编辑方法性能的基准数据集。
什么是3D-FRONT数据集3D-FRONT数据集是一个大规模且综合性的合成室内场景数据集,旨在提供高质量的[…]
LAION-5B是一个大规模的多模态数据集,用于研究目的,包含约58.5亿个图像-文本对。这些数据对是通过CLIP模型过滤的,其中23亿对包含英语文本,22亿对来自超过100种其他语言,其余12.7亿对则包含无法明确归类于某一语言的文本。
WebVid10M数据集是一个大型的文本-视频配对数据集,包含大约1000万个视频及其对应的文本描述。该数据集[…]
Objaverse-XL
Objaverse数据集是一个包含超过80万个注释3D物体的庞大数据集,每个3D模型都附有描述性标题、标签和动画。
OpenXD-RenFace是唯一的大规模全头且包含丰富细粒度发型的人头数据集,同时包含音素均衡的话术视频。
THHuman数据集是一个用于3D人体重建的研究数据集,它利用了DoubleFusion技术收集了230个人物的序列,并从中挑选了7000个数据。
DarkFace数据集(DARK FACE dataset)是一个专门用于低光照条件下的面部检测的数据集。该数据集包含6000张真实世界中的低光照图像,这些图像在夜间拍摄于教学楼、街道、桥梁、立交桥和公园等地点,并且所有图像都标注了人脸的边界框,作为主要的训练和/或验证集。此外,还提供了9000张未标注的低光照图像,以及一个独特的789对低光照图像配对集。
DPED数据集(Deep Photo Enhancement Dataset)是一个大型的图像数据集,主要用于深度学习模型的训练和验证。该数据集包含从不同设备拍摄的真实照片,包括三部不同的手机和一台高端反光相机。
SICE数据集(Single Image Contrast Enhancement)是一个专门用于单张图像对比度增强的数据集。该数据集包含多个部分,其中Part1和Part2是主要的部分,Lowlight_img文件夹内为低照度图像,Lowlight_img_label文件夹内为对应的正常光图像。
什么是ExDark数据集ExDark数据集是一个专为促进弱光环境下的物体检测和图像增强研究而设计的数据集。该[…]
HQ-Edit 是由加州大学圣克鲁斯分校的研究团队创建的一个高质量、基于指令的图像编辑数据集。
Handfit-3K数据集是一个专门用于虚拟试穿(Virtual Try-on)的公开数据集,主要用于任意手部姿势遮挡情况下的手部遮挡场景。该数据集由VTON-HandFit项目团队自行收集,并在多个评估中表现出色。
DIS5K是一个用于二分图像分割(DIS)任务的数据集,包含5,470张高分辨率图像。
IGPair数据集是一个大规模的互动服装配对数据集,包含超过30万对服装和穿戴图像,旨在解决虚拟试衣和人像合成领域中数据不足的问题。
The Pile是一个由EleutherAI提供的825 GiB大小的多样化、开源语言建模数据集,它由22个较小的、高质量的数据集组合而成。这些子集包括书籍、新闻、维基百科、GitHub代码、科学论文和对话记录等,每个子集都具有其独特性。
Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对
什么是3DRealCar3DRealCar是理想提出第一个大规模3D实车数据集,包含2500辆在真实[…]
Facet数据集包含32,000张图片和50,000个人体图像,同时包含来自SA-1B的69,000个口罩的人物、头发和衣服标签。