机器视觉处理

ShapeNet数据集

ShapeNet数据集是一个大规模、注释丰富的3D形状数据集，由普林斯顿大学、斯坦福大学和芝加哥丰田技术学院的研究人员共同开发。该数据集包含超过300万个3D CAD模型，其中220,000个模型被分类到3135个类别中。

Objaverse数据集

Objaverse是一个大规模的3D对象数据集，旨在解决当前3D数据集规模有限、对象类别多样性不足的问题。

Multimodal C4数据集

MultimodalC4的数据集是一个开放的、10亿规模的、与文本交错的图像语料库，其中包含了585M[…]

Custom Diffusion数据集

Custom Diffusion数据集是与Custom Diffusion技术相关的数据集，主要用于支持和实现多概念定制化的文本到图像生成模型。

NEXET数据集

NEXET数据集是由以色列公司Nexar发布的一个用于自动驾驶技术发展的数据集。该数据集包含来自全球80个国家的超过5万张照片，展示了不同天气和时间条件下道路状况。

HD-VILA-100M数据集

HD-VILA-100M数据集是一个大规模、高分辨率和多样化的视频语言数据集，由微软亚洲研究院的研究人员开发。

CelebA-HQ数据集

CelebA-HQ数据集是CelebA数据集的高质量版本，由30,000张分辨率为1024x1024的人脸图像组成.

CelebA数据集

CelebA数据集，全称为CelebFaces Attributes Dataset，是由中国香港中文大学多媒体实验室发布的一个大规模人脸属性数据集。

RELLISUR数据集

什么是RELLISUR数据集RELLISUR数据集是一种由德国卡尔斯鲁厄理工学院和南部联邦大学共同创建的视觉[…]

RAISE数据集

RAISE数据集是一个用于数字图像取证研究的大型数据集，包含8156张高分辨率的RAW图像，这些图像未经过压缩且保证是相机原生的（即从未被处理或修改过）。

GarDiff

GarDiff是一种创新的虚拟试穿技术，旨在通过生成高保真且细节丰富的试穿图像来提升在线试穿体验。

DressCode数据集

DressCode数据集是一个用于图像基础虚拟试衣的高分辨率多类别数据集。

CelebV-Text数据集

CelebV-Text数据集是一个大规模、高质量、多样化的人脸文本-视频数据集，旨在促进人脸文本到视频生成任务的研究。该数据集包含70,000个野外面部视频剪辑，每个视频剪辑都配有20个文本描述。

SA-1B数据集

SA-1B 数据集，全称为Segment Anything 1 Billion，是一个大规模的图像分割数据集，旨在为通用对象分割模型提供训练数据。

DreamBooth数据集

DreamBooth数据集是一个用于训练扩散模型以识别和生成特定个体图像的数据集。

Fashion-MNIST数据集

Fashion-MNIST数据集是由德国Zalando公司提供的一种服饰物品图像数据集，旨在替代经典的MNIS[…]

DragBench数据集

DragBench数据集是一个用于评估交互式点基图像编辑方法性能的基准数据集。

3D-FRONT数据集

什么是3D-FRONT数据集3D-FRONT数据集是一个大规模且综合性的合成室内场景数据集，旨在提供高质量的[…]

WebVid10M数据集

WebVid10M数据集是一个大型的文本-视频配对数据集，包含大约1000万个视频及其对应的文本描述。该数据集[…]

Objaverse-XL

Objaverse-XL

Objaverse数据集

Objaverse数据集是一个包含超过80万个注释3D物体的庞大数据集，每个3D模型都附有描述性标题、标签和动画。

OpenXD-RenFace数据集

OpenXD-RenFace是唯一的大规模全头且包含丰富细粒度发型的人头数据集，同时包含音素均衡的话术视频。

THuman数据集

THHuman数据集是一个用于3D人体重建的研究数据集，它利用了DoubleFusion技术收集了230个人物的序列，并从中挑选了7000个数据。

DarkFace数据集

DarkFace数据集（DARK FACE dataset）是一个专门用于低光照条件下的面部检测的数据集。该数据集包含6000张真实世界中的低光照图像，这些图像在夜间拍摄于教学楼、街道、桥梁、立交桥和公园等地点，并且所有图像都标注了人脸的边界框，作为主要的训练和/或验证集。此外，还提供了9000张未标注的低光照图像，以及一个独特的789对低光照图像配对集。