9月12日,阿里云正式推出***一代GPU实例GN5i。这款产品主要适用于深度学习的在线推理(Inference)阶段,可一键部署TensorFlow等主流深度学习框架,提供智能调度、自动运维、实时扩容等服务。人工智能产业用户可通过GN5i搭建微秒级响应的AI服务,在线服务成本减少50%以上。
阿里云官网显示,GN5i采用了英伟达Pascal架构P4图形处理器,提供***45Tops INT8整型计算能力和11TFlops FP32单精度浮点计算能力,在满足数据处理吞吐的基础上,时延***可达微秒级。支持小时付费,也支持包月包年。
此外,针对自建GPU服务器经常会遇到的扩容难、适配难的问题,GN5i规格族提供了灵活弹性的系列化配置,可以根据深度学习计算力的要求,按需选择合适的规格,分钟级即可完成实例的创建,并可根据运算力需求进行GPU实例的“Scale-out”水平扩容或“Scale-up”垂直变配。
阿里云高级技术专家龙欣介绍,在面向AI深度学习在线推理场景时,GN5i实例能够给客户带来以下价值:
· 稳定的企业级GPU计算能力,保障深度学习推理任务处理效率;
· 全面兼容主流深度学习框架,如TensorFlow、Caffe、MXNet、CNTK等;
· 配备阿里云高性能SSD云存储,加速数据的读取性能;搭配阿里云的OSS存储服务,能达到***的存储性价比;
· 在满足数据处理吞吐的基础上,时延***可达微秒级;
· 推理型专用GPU,大幅降低AI在线服务建设成本;
· GN5i的推出进一步丰富了阿里云异构计算家族的产品线。针对模型训练学习,阿里云在今年5月推出了高性能GPU实例GN5,单实例最多可提供8个英伟达 P100 GPU、2万多个并行处理核心,***75TFLOPS FP32单精度浮点、150 TFLOPS FP16半精度浮点和37 TFLOPS FP64双精度浮点运算能力,每个P100搭配的16GB HBM2 3D堆叠内存提供了高达732GB每秒的数据传输速率,配合GN5i可有效保障深度学习的处理效率。
除了产品层面,阿里云还提供了全方位的人工智能产业服务,包括智能语音交互、图像/视频识别、交通预测、情感分析等技术服务,这些技术正通过阿里云ET对外输出。过去一年,阿里云推出ET城市大脑、ET工业大脑、ET医疗大脑等行业垂直的人工智能系统,为工厂或者医院创造更多利润或者更高的诊断准确率。