数据集 | 第 2 页

DPED数据集（Deep Photo Enhancement Dataset）是一个大型的图像数据集，主要用于深度学习模型的训练和验证。该数据集包含从不同设备拍摄的真实照片，包括三部不同的手机和一台高端反光相机。

SICE数据集（Single Image Contrast Enhancement）是一个专门用于单张图像对比度增强的数据集。该数据集包含多个部分，其中Part1和Part2是主要的部分，Lowlight_img文件夹内为低照度图像，Lowlight_img_label文件夹内为对应的正常光图像。

什么是ExDark数据集ExDark数据集是一个专为促进弱光环境下的物体检测和图像增强研究而设计的数据集。该[…]

HQ-Edit 是由加州大学圣克鲁斯分校的研究团队创建的一个高质量、基于指令的图像编辑数据集。

Handfit-3K数据集是一个专门用于虚拟试穿（Virtual Try-on）的公开数据集，主要用于任意手部姿势遮挡情况下的手部遮挡场景。该数据集由VTON-HandFit项目团队自行收集，并在多个评估中表现出色。

DIS5K是一个用于二分图像分割（DIS）任务的数据集，包含5,470张高分辨率图像。

IGPair数据集是一个大规模的互动服装配对数据集，包含超过30万对服装和穿戴图像，旨在解决虚拟试衣和人像合成领域中数据不足的问题。

The Pile是一个由EleutherAI提供的825 GiB大小的多样化、开源语言建模数据集，它由22个较小的、高质量的数据集组合而成。这些子集包括书籍、新闻、维基百科、GitHub代码、科学论文和对话记录等，每个子集都具有其独特性。

Vimeo25M是一个全面且多样化的视频数据集，包含2500万个文本-视频对

什么是3DRealCar3DRealCar是理想提出第一个大规模3D实车数据集，包含2500辆在真实[…]

Facet数据集包含32,000张图片和50,000个人体图像，同时包含来自SA-1B的69,000个口罩的人物、头发和衣服标签。

DOTA是用于航空图像中目标检测的大规模数据集。它可以用于开发和评估航空影像中的物体检测。对于DOTA数据集，它包含来自不同传感器和平台的2806个航拍图像。

HRSID数据集是电子科技大学在2020年1月发布数据集，HRSID是高分辨率SAR图像中用于船舶检测、语义分割和实例分割任务的数据集。该数据集共包含5604张高分辨率SAR图像和16951个ship实例。

CVonline: Image Databases是一个专门整理的图像和视频数据库，旨在为视觉研究和算法评估提供支持。该数据库涵盖了多个领域的数据集，包括但不限于动作数据库、农业、属性识别、自主驾驶、生物医学以及相机等方面

Awesome Public Datasets是一个由awesomedata社区维护的GitHub存储库，提供了一个由域分类的完整的数据集列表。这个数据集包含了广泛的数据集资源，覆盖了农业、生物、数据竞赛、教育、金融、健康等多个领域。

千言数据集不仅提供了一站式的数据集浏览、整理、下载和评测的科研体验，还通过收集和整理不同类型的中文开源数据集，为自然语言处理技术的研究和发展提供了重要的数据支持。

极市公开数据集简介极市公开数据集主要集中在计算机视觉领域，为开发者提供了大量高质量的真实场景数据集，以帮助他[…]

百度飞桨提供了大量的开放数据集，这些数据集覆盖了机器学习和深度学习的各大领域，包括计算机视觉、语音、自然语言处理等。飞桨的数据集不仅数量众多，而且涵盖了多个应用方向，如文本分类、序列标注、语义匹配等NLP任务，以及问答、翻译、对话以及信息抽取等自然语言处理应用的多个方向。

用于单人姿态估计的MPII人体姿态数据集由大约 25K 幅图像组成，其中 15K 是训练样本，3K 是验证样本，7K 是测试样本（作者保留了这些标签）。