首页 产品 元脑®人工智能服务器 管理平台 AIStation

AIStation

AIStation人工智能开发平台帮助企业构建高效的深度学习开发平台,统一管理调度企业AI计算资源,提供完整的AI软件栈和开发流程,降低资源投入,提升开发效率。

产品特性
  • 实现GPU资源池化

    GPU共享调度策略,实现GPU单卡复用,单卡最大支持64任务复用。支持按任意粒度进行分配隔离,用户根据显存动态申请GPU资源

  • 具备数据加速机制

    训练数据“零拷贝”传输,多线程拉取,数据增量更新、亲和性调度等策略大幅缩短数据缓存周期,提升模型开发和训练效率

  • 高效的分布式训练

    高效的分布式训练,支持Tensorflow,Pytorch等主流框架扩展分布式训练,用户通过简单的资源、训练脚本配置即可提交分布式训练

  • 具备训练任务容错能力

    针对服务器意外宕机和GPU掉卡问题造成的任务中断,平台的容错机制有效保证任务的持续训练,减少因物理设备意外情况造成的时间浪费

性能测试
数据缓存提升模型训练效率

用resnet50 benchmark测试,随着任务并发数的增加,AIStation数据缓存功能的模型训练效率明显提升。在70任务并发下,模型训练效率提升72%。

分布式训练效率提升

在resnet50做分布式训练测试,随着任务并发数增加,在AIStation做多卡分布式训练的GPU加速比最高可提升90%。

相关资料