亚马逊云科技2024 re-Invent大会在拉斯维加斯落下帷幕,发布了相当多让人印象深刻的新产品。那么,我们该如何理解种种发布背后的创新呢?
如果说,创新是亚马逊的DNA,那么作为全球云计算的No.1,亚马逊云科技会在“生成式AI创新”进行怎样的基因表达呢?
很多人也许会从基础设施层、模型层、应用层去解构2024年亚马逊云科技re-Invent大会上推出的一系列面面俱到的产品功能或服务创新。
但这里更想从新推出的Nova系列大模型和新一代Amazon Sagemaker角度出发,去窥探亚马逊云科技独有风格的GenAI创新叙事。
从Titan到Nova:不拘一格的6款模型打法
从2022年年底开始,很多国内外的科技巨头纷纷在大模型训练上展开了与OpenAI的追赶角逐。而作为云计算的No.1,亚马逊云科技却很少在明面的battle中去狂秀肌肉。
直到这个月初,亚马逊云科技一口气发布了六款Nova基础模型,同时Amazon Bedrock 也集成了100多款三方的模型。相信很多人跟我们一样好奇:亚马逊云科技这波“不发则已,一发惊人”的操作,背后是出于怎样的目的?
在采访中,亚马逊云科技大中华区产品总经理陈晓建告诉了我们答案:
亚马逊云科技去年提供了嵌入式模型Titan,今年推出了包括六个不同定位模型的Nova系列,未来还会推出speech to speech和any to any等模型。推出这些模型的重点是为用户提供更好的选择,使其能与产品更好地结合,实现更好的集成。模型的推出基于逆向工作法,通过了解客户需求来确定,比如根据用户在Micro、Lite、Pro、Premier 等不同层面的诉求来构建模型,未来也会推出更多不同能力和定位的模型。
对于Amazon Bedrock集成100多款三方模型的打法,亚马逊云科技大中华区数据分析与生成式AI的产品总监崔玮补充道,整体策略是以客户需求为主的逆向工作法,致力于给客户更多选择,通过Amazon Bedrock 平台部署一方和三方模型,满足客户多样化需求。
为什么不是通用大模型,而是6款专用模型
回到这次Nova系列模型的推出,大家会发现这些模型各有各的强项和优势:
Amazon Nova Micro专门用于处理文本、Amazon Nova Lite 和Amazon Nova Pro,即将推出的Amazon Nova Premier专攻多模态的理解(文本、图像、视频),此外,还有图像生成模型Amazon NovaCanvas 和视频生成模型Amazon Nova Reel。
综合在一起看,你就会发现,这些Nova模型基本都是在强调低成本、快速响应,同时又都是基于实际工作生活的使用(推理)场景所亟需的。
进一步看,在未来推理将无处不在,所有业务都可能会应用到大模型提供的推理能力。对亚马逊云科技而言,需要向客户提供一个能够支持规模化推理的平台,以充分应用亚马逊云科技的推理能力,并帮助客户用好自己的私有化数据,实现性能、安全和成本方面的平衡,这也是亚马逊云科技在re:Invent大会期间推出Amazon Nova系列模型的初衷。
为什么不是推出一个全能的通用模型?亚马逊云科技大中华区数据分析与生成式AI的产品总监崔玮解释了这样做的原因——
“我们这样做是因为看到客户从可行性研究进入生产阶段时,必然会权衡模型的延时(latency)、成本和性能。”
比如,有时客户为确保准确性(accuracy),可能接受较慢的响应速度和较高成本,此时会选择大模型;而对于一些日活跃用户(DAU)达十万或百万级的互联网企业,可能无法承受大模型的高成本,就会选择在性能尚可的情况下成本较低的模型。在性能(performance)尚可的情况下,客户会倾向于选择成本较低的模型来服务业务。
实际上,客户会基于自身的用例以及对业务投资回报率(ROI)的考量,去判断如何匹配和组合模型。在大型场景下的多个任务中,客户通常会使用不同模型来解决不同业务问题,进而组建一个整体解决方案,这是极为常见的做法。
关于快速响应原理,我们在提及 Nova 模型时会涉及到“优化的低延迟推理”,这是Amazon Bedrock提供的一项新功能。实现快速响应的原理是从模型本身的部署和架构,到Amazon Bedrock提供的能力,再到底层基础设施,实现了端到端的保障,从而确保整个过程的快速响应。
新老一代的Amazon SageKaker背后
细心的朋友会发现,除了Nova大模型,自研芯片Trainium3等硬货,亚马逊云科技此次众多发布产品中还有一个不得忽视的变化,即,大家比较熟悉的以前的Amazon SageMaker,现在更名为Amazon SageMaker AI,同时亚马逊又重新定义了新一代Amazon SageMaker。新一代的Amazon SageMaker涵盖了分析、数据处理、搜索、数据准备、AI模型开发和训练、⽣成式AI等所有必需功能,同时全部功能都可以通过统⼀的企业数据视图实现。
崔玮同样解释了这种变化背后的归因。因为在大的方向上,“客户在构建整个生成式AI的旅程时,需要的不只是模型,甚至不只是生成AI这个词,更多的是数据加AI的统一。新一代Amazon SageMaker就是数据加AI,首先是统一,统一的平台;第二它要开放,第三还是要安全。我们会通过这三层,给客户提供从数据到AI的一体化的感受。”
而对于大家比较熟悉的以前的Amazon SageMaker,定位还是AI开发方面,所以现在叫Amazon SageMaker AI,它也有很多新的这个功能发布。Amazon SageMaker AI推出四项创新,助力企业更快使用热门的公开模型,最大化训练效率、降低成本,并使用其首选工具加速生成式AI模型的开发。
一窥亚马逊持续创新哲学
这时你就会发现,大到模型的发布,小到一个工具的更名,亚马逊云科技都做了如此“工匠”级的精心设计和需求验证。这背后其实都是亚马逊前文提到的“逆向工作法”的创新哲学。
那么,如何理解逆向工作法?陈晓建在亚马逊云科技2024re-Invent中国站的主题演讲中做出了解释:
“我们始终在倾听客户的心声,着眼于长远的发展。感谢成为我们客户的企业,正是因为他们愿意抽出宝贵的时间,帮助我们去了解什么是客户真正需要的云计算功能,以及如何为客户提供更好的服务,从而在过去十多年我们才能够基于客户需求不断创新,来最终满足这些需求。这个就是我们常说的customer obsession walking backwards,以客户为中心、逆向工作法。这个已经深深地融入到亚马逊云科技的基因之中,从最开始创立的时候就已经确立。”
这也让人想到了今年re-Invent大会上,亚马逊云科技高级副总裁Peter DeSantis那句比喻:
“亚马逊雨林的扶壁根系,支撑着世界上最大的树木生长在并不稳定的土壤系统中。扶根可以从一棵树的底部延伸数百英尺,并与附近的树木互锁构成一个坚实的基础,来支撑这些巨大的雨林。而亚马逊云科技最独特的事情之一,是我们的领导者能够在细节上花费大量时间精力,去了解客户和服务真正发生了什么事情,从而能够快速做出决定,甚至有可能在问题发生之前就解决或预防它们。”
理解了这一点,也就理解了这次亚马逊云科技2024re-Invent大会上推出的发布为什么会多到让人眼花缭乱,但每一项发布都能让你找到似曾相识的场景和痛点。理解了这一点,也就窥见了亚马逊云科技独有的re-Invent创新文化。