什么是人工智能平台PAI

AI解读 4个月前 硕雀
73 0

什么是人工智能平台PAI

人工智能平台PAI起初是服务于阿里巴巴集团内部(例如淘宝、支付宝和高德)的机器学习平台,致力于让公司内部开发者更高效、简洁、标准地使用人工智能AIArtificial Intelligence)技术。随着PAI的不断发展,2018年PAI平台正式商业化,目前已经积累了数万的企业客户和个人开发者,是中国云端机器学习平台之一。

PAI底层支持多种计算框架:

  • 流式计算框架Flink。
  • 基于开源版本深度优化的深度学习框架TensorFlowPyTorch、Megatron和DeepSpeed。
  • 千亿级特征样本的大规模并行计算框架Parameter Server。
  • Spark、PySpark、MapReduce等业内主流开源框架。

PAI提供的服务:

  • 可视化建模和分布式训练Designer,详情请参见可视化建模(Designer)。
  • Notebook交互式AI研发DSW(Data Science Workshop),详情请参见交互式建模(DSW)。
  • 分布式训练DLC(Deep Learning Containers),详情请参见分布式训练(DLC)。
  • 在线预测EAS(Elastic Algorithm Service),详情请参见模型在线服务(EAS)。

PAI依托于阿里云及阿里巴巴集团多年的应用及技术积累,具备以下多种优势。

  • AI 研发全生命周期全链路:
  1. 支持数据标注、模型开发、模型训练、模型优化、模型部署以及AI运维管控,是一站式AI平台。
  2. 拥有140+种优化的内置算法组件。
  3. 支持业内TensorFlow、PyTorch等多种深度学习框架。
  4. 提供多种模式、大数据引擎深度结合、多框架兼容、自定义镜像等核心能力。
  5. 提供云原生架构的AI开发、训练、部署的产品。
  • 多样的产品输出方式:
  1. 公共云支持全托管、半托管。
  2. 支持AI 高性能计算集群和轻量化输出产品形态。
  • 业内领先的AI优化:
  1. 高性能的训练框架,稀疏训练场景,支持数十亿到数百亿的稀疏特征规模,数百亿到数千亿的样本规模,上千worker的分布式增量训练。
  2. 主流框架模型加速,使用PAI Blade提升RestNet50、Transformer+LM等十数个主流模型加速比。
  • 该服务支持单独或组合使用。支持一站式机器学习,您只需准备好训练数据(存放到OSS或MaxCompute中),所有建模工作(包括数据上传、数据预处理特征工程、模型训练、模型评估和模型发布至离线或在线环境)都可以通过PAI实现。
  • 对接DataWorks,支持SQL、UDF、UDAF、MR等多种数据处理方式,灵活性高。
  • 生成训练模型的实验流程支持DataWorks周期性调度,且调度任务区分生产环境和开发环境,从而实现数据安全隔离。
来源:www.aiug.cn
声明:文章来源于网络,如有侵权请联系删除!