常用的计算机视觉AI数据集包括以下几种:
MNIST:这是一个手写数字数据库,包含60,000个训练样本和10,000个测试样本,每个样本图像的宽高为28x28。
ImageNet:这是目前深度学习图像领域应用非常广泛的数据集,主要用于图像分类、定位和检测等研究工作。
CIFAR-10 & CIFAR-100:这两个数据集分别包含60,000张32x32彩色图像和60,000张32x32彩色图像及其标签。CIFAR-10有10个类别,而CIFAR-100有100个类别。
PASCAL VOC:这是一个标准化的计算机视觉数据集,用于对象检测和识别,提供了一系列带有标注的图像。
COVID-19 X-Ray Dataset (V7):这个数据集主要用于医学影像领域的研究,特别是COVID-19相关的X光图像分析。
LSUN:这是一个大规模的室内场景图像数据集,包含大量高质量的房间内部照片。
Kinetics-700:这个数据集主要用于动作识别和姿态估计,包含700个动作类别。
Kitti:这是一个计算机视觉算法评测数据集,主要用于自动驾驶场景下的相关测试,涵盖立体图像、光流、视觉测距、3D物体检测和3D追踪等。
MS COCO:这是一个规模大且丰富的物体检测、分割和字幕数据集,包含330K图像和80个物体类别。
这些数据集在计算机视觉领域的研究和应用中起到了重要作用,帮助研究人员和开发者训练和测试各种算法和模型。
声明:文章来源于网络,如有侵权请联系删除!