算模一体化平台基于多集群部署赛尔算力调度平台和多云容器管理平台,将每个节点的CPU、GPU、内存资源进行统一纳管,算力调度平台提供多区多类型资源融合、多样异构算力支持、分布式调度与管理、智能生态应用支撑的核心能力,多云管理平台提供容器服务、编排调度、多与资源管理、多云集群管理的核心能力。底层支持英伟达系列显卡及多版本的CUDA驱动,上层支持Tensorflow、PyTorch、百度飞桨、等多种深度学习工具,以高效完成AI模型应用,涵盖计算机视觉、自然语言处理、智能芯片、智适应学习、自主无人系统等各个领域。
设计理念
实现多元算力的统一管理。不同行业、不同场景对 IT 基础设施的要求越来越精细化,算力中心承载的业务越来越多样化,不同行业对于算力的需求越来越高。
实现应用的跨平台利用。复杂的应用需要调用不同的算力来支撑,所以要求在不同的算力平台上对不同的应用有完善的支撑体系。
实现存储资源的共享。客户对于存储的需求是多样的、复杂的,跨存储拷贝数据经常花费客户大量的时间与精力,保持数据在不同存储间流动。
构建一个高效、灵活且易于使用的平台,帮助用户快速构建和训练模型,降低开发成本和时间,推动人工智能技术的广泛应用和发展。
目的
为实现多元算力统一管理、应用的跨平台应用、存储资源的共享、降低运维的难度,提供算力调度平台实现算力灵活调度和优化。
提供算力租用和灵活调度的的算力调度平台,面向高性能计算、人工智能以及智算中心应用设计,适用于全行业的高性能计算和高性能数据分析应用场景。提供资源管理,任务调度能力,旨在实现高效、灵活、智能的算力服务,助力高性能AI计算。