降低人工智能成本50% 阿里云推出新一代异构实例GN5i-51CTO.COM

9月12日，阿里云正式推出***一代GPU实例GN5i。这款产品主要适用于深度学习的在线推理(Inference)阶段，可一键部署TensorFlow等主流深度学习框架，提供智能调度、自动运维、实时扩容等服务。人工智能产业用户可通过GN5i搭建微秒级响应的AI服务，在线服务成本减少50%以上。

阿里云官网显示，GN5i采用了英伟达Pascal架构P4图形处理器，提供***45Tops INT8整型计算能力和11TFlops FP32单精度浮点计算能力，在满足数据处理吞吐的基础上，时延***可达微秒级。支持小时付费，也支持包月包年。

此外，针对自建GPU服务器经常会遇到的扩容难、适配难的问题，GN5i规格族提供了灵活弹性的系列化配置，可以根据深度学习计算力的要求，按需选择合适的规格，分钟级即可完成实例的创建，并可根据运算力需求进行GPU实例的“Scale-out”水平扩容或“Scale-up”垂直变配。

阿里云高级技术专家龙欣介绍，在面向AI深度学习在线推理场景时，GN5i实例能够给客户带来以下价值：

· 稳定的企业级GPU计算能力，保障深度学习推理任务处理效率;

· 全面兼容主流深度学习框架，如TensorFlow、Caffe、MXNet、CNTK等;

· 配备阿里云高性能SSD云存储，加速数据的读取性能;搭配阿里云的OSS存储服务，能达到***的存储性价比;

· 在满足数据处理吞吐的基础上，时延***可达微秒级;

· 推理型专用GPU，大幅降低AI在线服务建设成本;

· GN5i的推出进一步丰富了阿里云异构计算家族的产品线。针对模型训练学习，阿里云在今年5月推出了高性能GPU实例GN5，单实例最多可提供8个英伟达 P100 GPU、2万多个并行处理核心，***75TFLOPS FP32单精度浮点、150 TFLOPS FP16半精度浮点和37 TFLOPS FP64双精度浮点运算能力，每个P100搭配的16GB HBM2 3D堆叠内存提供了高达732GB每秒的数据传输速率，配合GN5i可有效保障深度学习的处理效率。

除了产品层面，阿里云还提供了全方位的人工智能产业服务，包括智能语音交互、图像/视频识别、交通预测、情感分析等技术服务，这些技术正通过阿里云ET对外输出。过去一年，阿里云推出ET城市大脑、ET工业大脑、ET医疗大脑等行业垂直的人工智能系统，为工厂或者医院创造更多利润或者更高的诊断准确率。