天池数据集平台是由阿里云推出的,旨在为科研人员和开发者提供高质量、脱敏后的数据集和计算资源的开放平台。
OpenDataLab是一个由上海人工智能实验室发布的开源数据平台,旨在为大型AI模型提供高质量的开放数据集支持。
Papers with Code是一个集合了机器学习论文、代码实现、以及大量数据集的平台。它提供了3000+个机器学习数据集,覆盖了数百个任务和多种语言,旨在促进机器学习领域的研究和发展。
CVonline: Image Databases是一个专门整理的图像和视频数据库,旨在为视觉研究和算法评估提供支持。该数据库涵盖了多个领域的数据集,包括但不限于动作数据库、农业、属性识别、自主驾驶、生物医学以及相机等方面
千言数据集不仅提供了一站式的数据集浏览、整理、下载和评测的科研体验,还通过收集和整理不同类型的中文开源数据集,为自然语言处理技术的研究和发展提供了重要的数据支持。
极市公开数据集简介极市公开数据集主要集中在计算机视觉领域,为开发者提供了大量高质量的真实场景数据集,以帮助他[…]
百度飞桨提供了大量的开放数据集,这些数据集覆盖了机器学习和深度学习的各大领域,包括计算机视觉、语音、自然语言处理等。飞桨的数据集不仅数量众多,而且涵盖了多个应用方向,如文本分类、序列标注、语义匹配等NLP任务,以及问答、翻译、对话以及信息抽取等自然语言处理应用的多个方向。
Kaggle是一个专注于数据科学领域的在线学习平台,它被广泛认为是世界领先的数据科学学习平台之一。
帕依提提是一个人工智能数据科学社区,平台以“数据+模型+空间”为服务核心,为开发者和中小企业提供全链条的AI基础服务设施