在芯片领域有这么一句传言:
每过18天,就会出现一个新的XPU。
曾几何时,一个CPU打天下的时代早已不复存在了。
……
三巨头的XPU征途
很久很久以前,CPU还长这样。
1971年,英特尔发布世界上第一块微处理器CPU-4004。
被誉为“人类历史上最具革新性的产品之一”。
接着8008、8088、8086相继跟上,正式开启了以微处理器为计算机中央处理器的时代。
英特尔也因此坐稳了领头老大的位置,一骑绝尘。
然而随着互联网的高速发展,我们发现,在处理大规模与高速数据时,CPU很难满足需要。
于是它的小弟——GPU,隆重登场了!
在英特尔还在“继续做大做强CPU”和“去GPU市场试试水”之间徘徊不定时,英伟达已经在GPU领域站稳了脚跟。
2009年末,英特尔“痛下决心”宣布取消Larrabee图形芯片项目,彼时的英伟达已经推出Tesla,并大举进攻。
更不用提那个戏剧般的2006年——那是值得AMD一直吹牛到今天的一年。
这一年AMD以54亿美元的价格收购了ATI公司。
自此踏上了“两手都要抓,两手都要硬的道路”。
就这样,左手CPU,右手GPU,AMD“扬言”拳打NVIDIA,脚踢英特尔。
虽然英特尔曾信誓旦旦表示不做独立显卡,但真香定律适用于全人类,企业也不能例外。
尤其是AMD“大放厥词”在前,英特尔怎么能忍得下这口气。
果不其然,从2015年开始,英特尔开启“买买买”模式,疯狂拓展XPU领土。
- 2015年收购FPGA供应商Altera
- 2016年收购AI芯片供应商Nervana
- 2017年收购自动驾驶视觉处理公司Mobileye和AI芯片供应商Movidius
- 2018年收购eASIC
- 2019年收购云端AI芯片供应商Habana Labs
- 2021年收购RISC-V指令集架构的开发商SiFive。
- ……
自古以来,金钱的力量往往都是不容小觑的,
英特尔的疯狂输出成功帮助它打造了一支“CPU+GPU+加速器+FPGA”的XPU队伍,并且这个队伍还在不断扩充中,比如又一个新名词:IPU。
眼看“好兄弟”都在为开疆扩土一掷千金,英伟达也按捺不住了。
凭借一系列的收购,英伟达打出了一套CPU、DPU和GPU的“组合拳”。
CPU、GPU、DPU、IPU,还有没出场的TPU、NPU、APU等等,巨头们一直锲而不舍地创造新名词,XPU的队伍不断扩大,或许在不久的将来,26个字母将被全部用完。
下面一起来简单看看这些XPU家族吧。
CPU
CPU—— Central Processing Unit, 中央处理器,CPU之于计算机、服务器,也就相当于大脑对于人类的作用。
计算、控制、存储是CPU“大脑”布局谋略、发号施令、控制行动的主要表现形式。
CPU 是对计算机的所有硬件资源(如存储器、输入输出单元) 进行控制调配、执行通用运算的核心硬件单元。
CPU 是计算机的运算和控制核心。
如下图所示,CPU主要包括了计算单元、控制单元和存储单元:
我们可以很明显的看出,CPU的计算单元在整个结构中占比很少,故而相对于大规模并行计算能力,CPU更擅长于逻辑控制。
随着人们对更大规模与更快处理速度的需求的增加,CPU渐渐力不从心。
因此,GPU,它来了!
GPU
GPU——Graphics Processing Unit,图形处理器,跟它的名字一样,GPU最初是用在个人电脑、游戏机和一些移动设备上运行绘图运算工作的微处理器。
GPU的构成相对简单,有数量众多的计算单元和超长的流水线,特别适合处理大量的类型统一的数据。
不过GPU生来就是做小弟的命,不能单独工作,必须由CPU进行控制调用才行。
GPU的工作大部分都计算量大,但没什么技术含量,而且要重复很多很多次。
当CPU需要大量的处理类型统一的数据时,就可以调用GPU进行并行计算。
不过,GPU虽然叫图形处理器,但并不是只能处理图像。
GPU虽然是为了图像处理而生,但在结构上并没有专门为图像服务的部件,只对CPU的结构进行了优化与调整,
因此GPU可以被认为是一种较通用的芯片。
目前科学计算、密码破解、数值分析,海量数据处理等需要大规模并行计算的领域都有GPU的身影。
TPU
TPU——Tensor Processing Unit, 张量处理单元,TPU是由Google设计的定制机器学习芯片,用于执行其常规机器学习工作负载。
起初机器学习以及图像处理算法大部分都跑在CPU与GPU上面,但这两种芯片本质上是通用性芯片,在效能与功耗上不能紧密适配机器学习算法,且价格也比较贵,TPU便就此诞生了。
TPU是一种ASIC芯片,即应用型专用集成电路(Application-Specific Integrated Circuit),是一种专为某种特定应用需求而定制的芯片。
据称最早的TPU就比同期的标准CPU和GPU快15-30倍,效率(性能/瓦特)提升 30-80倍。
目前谷歌已经发布了第四代TPU,据称TPU v4每秒能够实现10万万亿次运算,将于今年向谷歌云用户提供服务。
DPU
DPU—— Data Processing Unit ,数据处理单元,DPU是面向数据中心的专用处理器。
CPU用于通用计算,GPU用于加速计算,而数据中心中传输数据的DPU则进行数据处理。
简单来说,CPU做不好,GPU做不了的那些计算任务,交给DPU就完事儿了。
有人说,DPU正在取代CPU作为数据中心服务器的中央控制点,建立以数据为中心的计算架构。
英伟达首席执行官黄仁勋将DPU称为“未来计算的三大支柱之一”。
要说带货还得服老黄,DPU的概念才提出没多久,
从国外巨头大佬英特尔、博通、英伟达、赛灵思、Marvell,到国内的创企中科驭数、星云智联、芯启源等等,都纷纷陷入了DPU热潮。
XPU全家桶:前途漫漫,挑战不绝
随着5G、AI等新技术不断发展,计算场景也更为丰富多样,XPU的发展成为大势所趋。
许多半导体巨头厂商都推出了多元化的芯片产品,不断充实自己的XPU“全家桶”。
不少创新公司同样不甘示弱,也纷纷推出了专属芯片产品,整个芯片市场迎来“百家争鸣”时刻。
然而值得注意的是,XPU不能仅仅是XPU,它不是硬件简单的物理堆砌,而要考虑到其中的互联互通,跨架构的软件协同,只有软硬件协同发展,才能更好发挥出产品应有的价值。
同样,技术创新还需要匹配用户的实际需求,这样才能在市场中打造自己的一番天地。