Caltech-256是一个由加利福尼亚理工学院收集整理的图像物体识别数据集,包含30,607张不同大小的真实世界图像,跨越257个类别(256个对象类别和一个额外的杂波类别)。每个类别至少由80张图像表示,确保了对象识别任务中有足够的样本来进行训练。
Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对
什么是3DRealCar3DRealCar是理想提出第一个大规模3D实车数据集,包含2500辆在真实[…]
Facet数据集包含32,000张图片和50,000个人体图像,同时包含来自SA-1B的69,000个口罩的人物、头发和衣服标签。
MNIST是一个手写数字数据集,包含一个60,000个样本的训练集和一个10,000个样本的测试集。
HDTF数据集是一个高清晰度说话人脸数据集,主要用于说话人脸的生成和分析。
MEAD数据集是一个专注于情感谈话头部视频的大规模、高质量视听数据集。它包含了带有情绪类别和强度注释的高质量谈话头部视频,
COWC带上下文信息的高架汽车(COWC)数据是头顶视角的带注释的汽车。对于训练、深度神经网络以学习目标检测检测或汽车计数很有用。
RSOD是一个开放的目标检测数据集,用于遥感图像中的目标检测。数据集包含飞机,油箱,运动场和立交桥,以PASCAL VOC数据集的格式进行标注。
DOTA是用于航空图像中目标检测的大规模数据集。它可以用于开发和评估航空影像中的物体检测。对于DOTA数据集,它包含来自不同传感器和平台的2806个航拍图像。
LEVIR数据集由大量 800 × 600 像素和0.2m〜1.0m /像素的高分辨率Google Earth图像和超过22k的图像组成。LEVIR数据集涵盖了人类居住环境的大多数类型地面特征,例如城市,乡村,山区和海洋。
DIOR是一个用于光学遥感图像目标检测的大规模基准数据集。数据集包含23463个图像和192472个实例,涵盖20个对象类。这20个对象类是飞机、机场、棒球场、篮球场、桥梁、烟囱、水坝、高速公路服务区、高速公路收费站、港口、高尔夫球场、地面田径场、天桥、船舶、体育场、储罐、网球场、火车站、车辆和风磨。
该项目是一个遥感影像领域常用的深度学习数据集的汇总,包括数据集基本信息,并附上数据集源地址与Aistudio备份链接(包括详细的类别信息,提供高速下载)。
HRSID数据集是电子科技大学在2020年1月发布数据集,HRSID是高分辨率SAR图像中用于船舶检测、语义分割和实例分割任务的数据集。该数据集共包含5604张高分辨率SAR图像和16951个ship实例。
高分辨率SAR舰船检测数据集-2.0(AIR-SARShip-2.0)发布300幅图像,图像分辨率包括1m和3m,成像模式包括聚束式和条带式,极化方式为单极化,极化方式为VV,场景类型包含港口、岛礁、不同等级海况的海面,目标覆盖运输船、油船、渔船等十余类数千艘舰船。
OpenSARShip是由上海交通大学高级传感技术中心(AST)开发的开放式SAR图像管理和处理平台,用于SAR图像的读取、处理、可视化和算法测试。
MSTAR数据集大多是静止车辆的SAR切片图像,还提供了大幅场景SAR图像
CVonline: Image Databases是一个专门整理的图像和视频数据库,旨在为视觉研究和算法评估提供支持。该数据库涵盖了多个领域的数据集,包括但不限于动作数据库、农业、属性识别、自主驾驶、生物医学以及相机等方面
用于单人姿态估计的MPII人体姿态数据集由大约 25K 幅图像组成,其中 15K 是训练样本,3K 是验证样本,7K 是测试样本(作者保留了这些标签)。
ImageNet是一个大型的视觉识别数据集,主要用于机器视觉领域的图像分类和目标检测。