大到大模型,小到产品更名,一窥云计算一哥的创新哲学

企业动态
从新推出的Nova系列大模型和新一代Amazon Sagemaker角度出发,去窥探亚马逊云科技独有风格的GenAI创新叙事。

亚马逊云科技2024 re-Invent大会在拉斯维加斯落下帷幕,发布了相当多让人印象深刻的新产品。那么,我们该如何理解种种发布背后的创新呢?

如果说,创新是亚马逊的DNA,那么作为全球云计算的No.1,亚马逊云科技会在“生成式AI创新”进行怎样的基因表达呢?

很多人也许会从基础设施层、模型层、应用层去解构2024年亚马逊云科技re-Invent大会上推出的一系列面面俱到的产品功能或服务创新。

但这里更想从新推出的Nova系列大模型和新一代Amazon Sagemaker角度出发,去窥探亚马逊云科技独有风格的GenAI创新叙事。

从Titan到Nova:不拘一格的6款模型打法

从2022年年底开始,很多国内外的科技巨头纷纷在大模型训练上展开了与OpenAI的追赶角逐。而作为云计算的No.1,亚马逊云科技却很少在明面的battle中去狂秀肌肉。

直到这个月初,亚马逊云科技一口气发布了六款Nova基础模型,同时Amazon Bedrock 也集成了100多款三方的模型。相信很多人跟我们一样好奇:亚马逊云科技这波“不发则已,一发惊人”的操作,背后是出于怎样的目的?

在采访中,亚马逊云科技大中华区产品总经理陈晓建告诉了我们答案:

亚马逊云科技去年提供了嵌入式模型Titan,今年推出了包括六个不同定位模型的Nova系列,未来还会推出speech to speech和any to any等模型。推出这些模型的重点是为用户提供更好的选择,使其能与产品更好地结合,实现更好的集成。模型的推出基于逆向工作法,通过了解客户需求来确定,比如根据用户在Micro、Lite、Pro、Premier 等不同层面的诉求来构建模型,未来也会推出更多不同能力和定位的模型。

对于Amazon Bedrock集成100多款三方模型的打法,亚马逊云科技大中华区数据分析与生成式AI的产品总监崔玮补充道,整体策略是以客户需求为主的逆向工作法,致力于给客户更多选择,通过Amazon Bedrock 平台部署一方和三方模型,满足客户多样化需求。

为什么不是通用大模型,而是6款专用模型

回到这次Nova系列模型的推出,大家会发现这些模型各有各的强项和优势:

Amazon Nova Micro专门用于处理文本、Amazon Nova Lite 和Amazon Nova Pro,即将推出的Amazon Nova Premier专攻多模态的理解(文本、图像、视频),此外,还有图像生成模型Amazon NovaCanvas 和视频生成模型Amazon Nova Reel。

综合在一起看,你就会发现,这些Nova模型基本都是在强调低成本、快速响应,同时又都是基于实际工作生活的使用(推理)场景所亟需的。

进一步看,在未来推理将无处不在,所有业务都可能会应用到大模型提供的推理能力。对亚马逊云科技而言,需要向客户提供一个能够支持规模化推理的平台,以充分应用亚马逊云科技的推理能力,并帮助客户用好自己的私有化数据,实现性能、安全和成本方面的平衡,这也是亚马逊云科技在re:Invent大会期间推出Amazon Nova系列模型的初衷。

为什么不是推出一个全能的通用模型?亚马逊云科技大中华区数据分析与生成式AI的产品总监崔玮解释了这样做的原因——

“我们这样做是因为看到客户从可行性研究进入生产阶段时,必然会权衡模型的延时(latency)、成本和性能。”

比如,有时客户为确保准确性(accuracy),可能接受较慢的响应速度和较高成本,此时会选择大模型;而对于一些日活跃用户(DAU)达十万或百万级的互联网企业,可能无法承受大模型的高成本,就会选择在性能尚可的情况下成本较低的模型。在性能(performance)尚可的情况下,客户会倾向于选择成本较低的模型来服务业务。

实际上,客户会基于自身的用例以及对业务投资回报率(ROI)的考量,去判断如何匹配和组合模型。在大型场景下的多个任务中,客户通常会使用不同模型来解决不同业务问题,进而组建一个整体解决方案,这是极为常见的做法。

关于快速响应原理,我们在提及 Nova 模型时会涉及到“优化的低延迟推理”,这是Amazon Bedrock提供的一项新功能。实现快速响应的原理是从模型本身的部署和架构,到Amazon Bedrock提供的能力,再到底层基础设施,实现了端到端的保障,从而确保整个过程的快速响应。

新老一代的Amazon SageKaker背后

细心的朋友会发现除了Nova大模型自研芯片Trainium3等硬货亚马逊云科技此次众多发布产品中还有一个不得忽视的变化大家比较熟悉的以前的Amazon SageMaker,现在更名为Amazon SageMaker AI,同时亚马逊又重新定义了新一代Amazon SageMaker。新一代的Amazon SageMaker涵盖了分析、数据处理、搜索、数据准备、AI模型开发和训练、⽣成式AI等所有必需功能,同时全部功能都可以通过统⼀的企业数据视图实现。

崔玮同样解释了这种变化背后的归因。因为在大的方向上,“客户在构建整个生成式AI的旅程时,需要的不只是模型,甚至不只是生成AI这个词,更多的是数据加AI的统一。新一代Amazon SageMaker就是数据加AI,首先是统一,统一的平台;第二它要开放,第三还是要安全。我们会通过这三层,给客户提供从数据到AI的一体化的感受。”

而对于大家比较熟悉的以前的Amazon SageMaker,定位还是AI开发方面,所以现在叫Amazon SageMaker AI,它也有很多新的这个功能发布。Amazon SageMaker AI推出四项创新,助力企业更快使用热门的公开模型,最大化训练效率、降低成本,并使用其首选工具加速生成式AI模型的开发。

一窥亚马逊持续创新哲学

这时你就会发现,大到模型的发布,小到一个工具的更名,亚马逊云科技都做了如此“工匠”级的精心设计和需求验证。这背后其实都是亚马逊前文提到的“逆向工作法”的创新哲学。

那么,如何理解逆向工作法?陈晓建在亚马逊云科技2024re-Invent中国站的主题演讲中做出了解释:

“我们始终在倾听客户的心声,着眼于长远的发展。感谢成为我们客户的企业,正是因为他们愿意抽出宝贵的时间,帮助我们去了解什么是客户真正需要的云计算功能,以及如何为客户提供更好的服务,从而在过去十多年我们才能够基于客户需求不断创新,来最终满足这些需求。这个就是我们常说的customer obsession walking backwards,以客户为中心、逆向工作法。这个已经深深地融入到亚马逊云科技的基因之中,从最开始创立的时候就已经确立。”

这也让人想到了今年re-Invent大会上,亚马逊云科技高级副总裁Peter DeSantis那句比喻:

“亚马逊雨林的扶壁根系,支撑着世界上最大的树木生长在并不稳定的土壤系统中。扶根可以从一棵树的底部延伸数百英尺,并与附近的树木互锁构成一个坚实的基础,来支撑这些巨大的雨林。而亚马逊云科技最独特的事情之一,是我们的领导者能够在细节上花费大量时间精力,去了解客户和服务真正发生了什么事情,从而能够快速做出决定,甚至有可能在问题发生之前就解决或预防它们。”

理解了这一点,也就理解了这次亚马逊云科技2024re-Invent大会上推出的发布为什么会多到让人眼花缭乱,但每一项发布都能让你找到似曾相识的场景和痛点。理解了这一点,也就窥见了亚马逊云科技独有的re-Invent创新文化。


责任编辑:张燕妮
相关推荐

2015-08-19 11:45:42

2012-06-07 09:48:10

云计算趋势

2023-04-17 09:00:00

WakeData惟客数据大模型

2009-06-10 09:01:46

SOASmartSOAIBM

2010-12-15 09:31:08

2024-04-10 12:42:51

AI模型

2024-11-20 13:24:10

2016-01-07 13:47:06

云计算私有云公共云

2023-11-15 15:37:21

大模型人工智能

2010-10-14 10:04:59

云计算创新企业

2016-11-04 23:29:40

云计算IT基础设施

2013-12-30 09:48:59

云计算CDN开源

2012-09-19 16:04:13

2024-11-01 10:16:09

API开源项目

2024-09-24 09:12:59

2019-08-16 10:43:45

2024-12-19 07:00:00

2024-12-11 12:58:57

点赞
收藏

51CTO技术栈公众号