HD-VILA-100M数据集是一个大规模、高分辨率和多样化的视频语言数据集,由微软亚洲研究院的研究人员开发。
CelebA-HQ数据集是CelebA数据集的高质量版本,由30,000张分辨率为1024x1024的人脸图像组成.
CelebA数据集,全称为CelebFaces Attributes Dataset,是由中国香港中文大学多媒体实验室发布的一个大规模人脸属性数据集。
什么是RELLISUR数据集RELLISUR数据集是一种由德国卡尔斯鲁厄理工学院和南部联邦大学共同创建的视觉[…]
RAISE数据集是一个用于数字图像取证研究的大型数据集,包含8156张高分辨率的RAW图像,这些图像未经过压缩且保证是相机原生的(即从未被处理或修改过)。
GarDiff是一种创新的虚拟试穿技术,旨在通过生成高保真且细节丰富的试穿图像来提升在线试穿体验。
DressCode数据集是一个用于图像基础虚拟试衣的高分辨率多类别数据集。
CelebV-Text数据集是一个大规模、高质量、多样化的人脸文本-视频数据集,旨在促进人脸文本到视频生成任务的研究。该数据集包含70,000个野外面部视频剪辑,每个视频剪辑都配有20个文本描述。
SA-1B 数据集,全称为Segment Anything 1 Billion,是一个大规模的图像分割数据集,旨在为通用对象分割模型提供训练数据。
DreamBooth数据集是一个用于训练扩散模型以识别和生成特定个体图像的数据集。
Fashion-MNIST数据集是由德国Zalando公司提供的一种服饰物品图像数据集,旨在替代经典的MNIS[…]
DragBench数据集是一个用于评估交互式点基图像编辑方法性能的基准数据集。
什么是3D-FRONT数据集3D-FRONT数据集是一个大规模且综合性的合成室内场景数据集,旨在提供高质量的[…]
WebVid10M数据集是一个大型的文本-视频配对数据集,包含大约1000万个视频及其对应的文本描述。该数据集[…]
Objaverse-XL
Objaverse数据集是一个包含超过80万个注释3D物体的庞大数据集,每个3D模型都附有描述性标题、标签和动画。
OpenXD-RenFace是唯一的大规模全头且包含丰富细粒度发型的人头数据集,同时包含音素均衡的话术视频。
THHuman数据集是一个用于3D人体重建的研究数据集,它利用了DoubleFusion技术收集了230个人物的序列,并从中挑选了7000个数据。
DarkFace数据集(DARK FACE dataset)是一个专门用于低光照条件下的面部检测的数据集。该数据集包含6000张真实世界中的低光照图像,这些图像在夜间拍摄于教学楼、街道、桥梁、立交桥和公园等地点,并且所有图像都标注了人脸的边界框,作为主要的训练和/或验证集。此外,还提供了9000张未标注的低光照图像,以及一个独特的789对低光照图像配对集。
DPED数据集(Deep Photo Enhancement Dataset)是一个大型的图像数据集,主要用于深度学习模型的训练和验证。该数据集包含从不同设备拍摄的真实照片,包括三部不同的手机和一台高端反光相机。
SICE数据集(Single Image Contrast Enhancement)是一个专门用于单张图像对比度增强的数据集。该数据集包含多个部分,其中Part1和Part2是主要的部分,Lowlight_img文件夹内为低照度图像,Lowlight_img_label文件夹内为对应的正常光图像。
什么是ExDark数据集ExDark数据集是一个专为促进弱光环境下的物体检测和图像增强研究而设计的数据集。该[…]
HQ-Edit 是由加州大学圣克鲁斯分校的研究团队创建的一个高质量、基于指令的图像编辑数据集。
Handfit-3K数据集是一个专门用于虚拟试穿(Virtual Try-on)的公开数据集,主要用于任意手部姿势遮挡情况下的手部遮挡场景。该数据集由VTON-HandFit项目团队自行收集,并在多个评估中表现出色。
DIS5K是一个用于二分图像分割(DIS)任务的数据集,包含5,470张高分辨率图像。
VoxCeleb2是一个大规模的说话人识别数据集,从开源媒体中自动收集而来。该数据集包含超过100万个话语片段,由6000多名不同背景的说话者提供。这些语音片段是在自然场景中收集的,因此包含了各种现实世界的噪音,如笑声、交谈声、频道效果和音乐等。
IGPair数据集是一个大规模的互动服装配对数据集,包含超过30万对服装和穿戴图像,旨在解决虚拟试衣和人像合成领域中数据不足的问题。
MS COCO数据集是一个大型的、丰富的物体检测,分割和字幕数据集。这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标,328,000影像和2,500,000个label。
VOC数据集是目标检测经常用的一个数据集,常见的VOC数据集有VOC2007以及VOC2012。
COCO2017数据集是由微软团队提供的一个大规模的目标检测、分割和图像描述数据集。该数据集包含多种标注类型,包括目标检测、关键点检测、素材分割、全景分割和图像说明。具体来说,COCO2017数据集的训练集包含118287张图片,验证集包含5000张图片。