在DDR5内存刚成为主流不久,如今三星又已经率先开始了下一代DDR6内存的早期开发,并预计在2024年之前完成设计。据悉,在近日召开的研讨会上,三星负责测试和系统封装(TSP)的副总裁透露,随着未来内存本身性能的扩大,封装技术也需要不断发展。经证实,三星已经处于下一代DDR6内存的早期开发阶段,将采用MSAP技术。目前,MSAP已经被三星的竞争对手(SK海力士和美光)用于DDR5中。
据介绍,下一代DDR6内存不仅将利用MSAP来加强电路连接,而且还将适应DDR6内存中增加的层数。就规格而言,DDR6内存的速度将是现有DDR5内存的两倍,传输速度可达12800 Mbps(JEDEC),超频后的速度可超过17000 Mbps。
预计三星将在2024年之前完成其DDR6设计,2025年之后才会有商业化的可能。
不知不觉间,从最初KB到GB的跃进,DDR内存已经走过了5代,开始向第6代进发。
“百转千回”的内存市场
什么是DDR?
在回顾DDR发展历程之前,先来了解下DDR是什么。
存储分为ROM和RAM。
ROM是Read Only Memory的缩写,即只读存储器,是一种只能读出事先所存数据的固态半导体存储器,其特性是一旦储存资料就无法再将其改变或删除,资料并不会因为电源关闭而消失。
RAM是Random Access Memory的缩写,即随机存储器 ,随机是指数据不是线性依次存储,可以以任何顺序访问,而不管前一次访问的是哪一个位置,RAM在掉电之后就会丢失数据。
而对于RAM,又分为SRAM(静态随机存储器)和DRAM(动态随机存储器)两大类。
SRAM是一种具有静止存取功能的内存,不需要刷新电路即能保存它内部存储的数据,也就是说加电情况下,不需要刷新,数据不会丢失。SRAM是早期读写最快的存储设备,但其缺点是集成度较低,功耗大,相同的容量体积较大,而且价格较高,少量用于关键性系统以提高效率,譬如CPU的一级缓存,二级缓存。
DRAM是最为常见的系统内存,只能将数据保持很短的时间。为了保持数据,DRAM使用电容存储,所以必须隔一段时间刷新一次,如果存储单元没有被刷新,存储的信息就会丢失。
后续的SDRAM和DDR SDRAM都是在DRAM的基础上发展而来,同时也属于DRAM中的一种。SDRAM(Synchronous DRAM,同步动态随机存储器),同步是指内存工作需要同步时钟,内部命令的发送与数据的传输都以时钟为基准。
DDR SDRAM (Double Data Rate SDRAM,双倍速率SDRAM ) 的不同之处在于它可以在一个时钟读写两次数据,这样就使得数据传输速度得以加倍。在性能和成本优势下,DDR SDRAM成为了目前电脑和服务器中用的最多的内存,这也就是我们今天要讨论的DDR内存。
DDR的演进之路
和其他硬件一样,内存遵循着摩根定律,从古老的SIMM到DDR的出现,再以DDR为基础进行迭代,内存标准和规格发生了很大变化。
从最初KB到GB的跃进,从单条1GB到单条16GB、32GB的进化,内存容量的发展经历了漫长的过程。
在最初的个人电脑上,内存是直接以DIP芯片的形式安装在主板的DRAM插座上面,需要安装8到9颗这样的芯片,容量只有64-256KB,想要扩展十分困难,但这内存容量对于当时的处理器以及程序来说已经足够。不过随着软件程序和新一代80286硬件平台的出现,程序和硬件对内存性能提出了更高要求,为了提高速度并扩大容量,内存必须以独立的封装形式出现,因而诞生了“内存条”的概念。
在80286主板刚推出的时候,内存条采用了SIMM接口,容量为30pin、256kb,必须是由8片数据位和1 片校验位组成1个bank。因此,我们见到的30pin SIMM一般是四条一起使用。自1982年PC进入民用市场一直到现在,搭配80286处理器的30pin SIMM 内存是内存领域的开山鼻祖。
时间来到上世纪90年代前后,PC技术迎来了新的发展高峰——386和486时代,此时CPU 已经向16bit发展,30pin SIMM 内存已经无法满足需求,其较低的内存带宽已经成为亟待解决的瓶颈,并且其8位的数据总线导致采购成本一点都不低,还会增加故障率。此时,72pin SIMM内存出现了。
72pin SIMM支持32bit快速页模式内存,内存带宽得以大幅度提升。72pin SIMM内存单条容量一般为512KB-2MB,而且仅要求两条同时使用,386、486以及后来的奔腾、奔腾Pro、早期的奔腾II处理器多数会用这种内存。由于其与30pin SIMM 内存无法兼容,因此30pin SIMM内存被时代淘汰出局。
早期的内存频率与CPU外频是不同步的,是异步DRAM,细分下去的话包括FPM DRAM(Fast Page Mode DRAM,快速页模式动态存储器)与EDO DRAM(Extended data out DRAM,外扩充数据模式存储器),常见的接口有30pin SIMM与72pin SIMM,工作电压都是5V。
FPM DRAM是从早期的Page Mode DRAM上改良过来的,当它在读取同一列数据时,可以连续传输行位址,不需要再传输列位址,可读出多笔资料,这种方法在当时是很先进的。
EDO DRAM内存是1991-1995年之间盛行的内存条,是72pin SIMM的一种,它拥有更大的容量和更先进的寻址方式,读取速度比FPM DRAM快不少,工作电压为一般为5V,带宽32bit,速度在40ns以上,主要应用在当时的486及早期的奔腾电脑上。
在1991到1995年EDO内存盛行的时候,凭借着制造工艺的飞速发展,EDO内存在成本和容量上都有了很大的突破,单条EDO内存容量达到4MB-16MB。由于奔腾及更高级别的CPU数据总线宽度都是64bit甚至更高,所以EDO RAM与FPM RAM基本都成对使用。
EDO的盛行时间大概是在奔腾到奔腾3之间,之后被SDRAM取代。
随着CPU的持续升级,Intel Celeron系列以及AMD K6处理器以及相关的主板芯片组的相继推出,EDO DRAM已经不能满足系统的需求,内存技术也发生了大革命,插座从原来的SIMM升级为DIMM,而内存也迎来了经典的SDR SDRAM时代。
SDRAM为内存带来了新生机,其64bit带宽与当时处理器总线宽度保持一致,这就表示一条SDRAM就能够让电脑正常运行,大大地降低了内存的购买成本。由于内存的传输信号与处理器外频同步,所以在传输速度上,DIMM标准的SDRAM要大幅领先于SIMM内存。
在这个迭代时期,由于Intel和AMD的频率之争,SDRAM内存由早期的66MHz,发展后来的100MHz、133MHz,内存规范也跟着从 PC66 发展到 PC100、PCIII、PC133 以及不太成功的 PC600、PC700、PC800。
尽管没能彻底解决内存带宽的瓶颈问题,但此时CPU超频已经成为DIY用户永恒的话题。在Intel与AMD的频率竞备时代,Intel为了达到独占市场的目的,与Rambus联合在PC市场推广Rambus DRAM内存,Rambus DRAM内存以高时钟频率来简化每个时钟周期的数据量,因此内存带宽相当出色。Rambus DRAM曾一度被认为是奔腾4的绝配。
尽管如此,曲高和寡的Rambus DRAM内存终究是生不逢时,后来被更高速度的DDR“掠夺”其宝座地位。在当时,PC600、PC700的Rambus RDRAM 内存因出现Intel820 芯片组“失误事件”、PC800 Rambus RDRAM因成本过高无法获得大众用户拥戴,种种问题让Rambus RDRAM胎死腹中,最终拜倒在DDR内存面前。
DDR时代来临
DDR
DDR SDRAM(简称DDR),可以说是SDRAM的升级版本,DDR在时钟信号上升沿与下降沿各传输一次数据,这使得DDR的数据传输速度为传统SDRAM的两倍。由于仅多采用了下降缘信号,因此并不会造成能耗增加。至于定址与控制信号则与传统SDRAM相同,仅在时钟上升沿传输。此外,由于DDR采用了SSTL2标准的2.5V电压,低于SDRAM的LVTTL标准下的3.3V电压,因此功耗更低。
DDR内存是作为一种在性能与成本之间折中的解决方案,其目的是迅速建立起牢固的市场空间,继而一步步在频率上高歌猛进,最终弥补内存带宽上的不足。
初代DDR内存的频率是200MHz,随后慢慢的诞生了DDR266、DDR333和那个时代主流的DDR400,至于那些500MHz、600MHz、700MHz的都算是超频条了。DDR内存刚出来的时候只有单通道,后来出现了支持双通道的芯片组,让内存的带宽直接翻倍,容量则是从128MB增加到1GB。
DDR2
随着CPU处理器前端总线带宽的不断提高和高速率局部总线的出现,DDR的性能成了制约处理器性能的瓶颈。因此 2003年Intel公布了 DDR2 SDRAM的开发计划。
与上一代DDR内存技术标准最大的不同就是,虽然同是采用了在时钟的上升/下降沿同时进行数据传输的基本方式,但DDR2内存却拥有两倍以上于上一代DDR内存预读取能力。
DDR2能够在100MHz 的发信频率基础上提供每插脚最少400MB/s的带宽,而且其接口将运行于1.8V电压上,从而进一步降低发热量,以便提高频率。从JEDEC组织者阐述的DDR2标准来看,针对PC等市场的DDR2内存将拥有400、533、667MHz等不同的时钟频率,高端DDR2内存拥有800、1000、1200MHz频率。
此外,值得注意的是,DDR2舍弃了传统的TSOP,开启了内存FBGA 封装之门,减少了寄生电容和阻抗匹配问题,增加了稳定性。
DDR3
2007年,JEDEC协会正式推出 DDR3 SDRAM规范,DDR3开始走向舞台。
相比于DDR2,得益于生产工艺的精进,DDR3的工作电压从1.8V降到1.5V和1.35V(DDR3L),进一步降低了功耗,减少了发热量,并采用了根据温度自动自刷新、局部自刷新等功能,在一定程度弥补了DDR3延迟时间较长的缺点。
同时,因为DDR3可以在1个时钟周期输出8bit的数据,而DDR2是4bit,因此其单位时间内的数据传输量是DDR2的2倍。DDR3的速度从800MHz起跳,最高可以达到1600MHz。DDR3内存与DDR2一样是240Pin DIMM接口,不过两者的防呆缺口位置是不同的,不能混插。常见的容量是512MB到8GB,当然也有单条16GB的DDR3内存,只不过很稀少。
Intel酷睿i系列(如LGA1156处理器平台)、AMD AM3主板及处理器的平台都是其“支持者”。
时至今日,DDR2和DDR3陆续开始退出市场。
三星已在2021年末Q4确定停产DDR2;同时三星及海力士计划逐步退出DDR3市场。根据DDR3市占率顶峰期2014年的数据(市占率达84%)显示,三星及海力士市场份额达67%,短期内,两大内存厂商退出市场将在供给端造成显著空缺。
DDR4
早在遥远的2007年,有关DDR4内存标准的一些信息就被公开。
在美国旧金山2008年8月举行的英特尔开发者论坛上,一位来自奇梦达的演讲嘉宾提供了更多关于DDR4的公开信息。在当年关于DDR4的描述中,DDR4将使用30nm制程,运行1.2V的电压、常规总线时钟频率速率在2133MT/s,“发烧”级别将达到3200MT/s,于2012年推出市场,到2013年时运行电压将改进至1V。
然而到了2011年1月,三星电子宣布完成DDR4 DRAM模块的制造和测试,采用30nm级工艺,数据传输率为2133MT/s,运作电压在1.2V,这也是史上第一条DDR4内存。在此之前,三星电子40nm制程的DRAM芯片的成功流片,成为DDR4发展的关键。
三个月之后,SK海力士宣布2400MT/s速率的2GB DDR4存储器模块面世,运作电压同样在1.2V,同时宣布预计在2012年下半年开始大批量生产。此后的2012年5月,美光宣布将在2012年后期使用30nm制程生产DRAM及闪存颗粒。
然而直到2014年,DDR4内存才首次得到应用,首款支持DDR4内存的是英特尔旗舰级x99平台。2014年底,起跳频率为2133MHz的DDR4内存产品陆续开始纷纷上市,随着2015年8月,英特尔发布Skylake处理器和100系列主板,DDR4开始真正走向大众,也标志着DDR4时代的到来。
与DDR3相比,DDR4的工作电压从1.5V降到1.2V和1.05V(DDR4L),这意味着功耗更低,发热量更小了。速度方面,DDR4从2133MHz起跳,最高速度可达4266MHz,接近DDR3的三倍。
原因在于,一方面DDR4除了可支持传统SE信号外,还引入了差分信号技术,即进化到了双向传输机制阶段;另一方面,DDR4采用了点对点的设计,简化了内存模块的设计,更容易实现高频化;此外,DDR4还采用了三维堆叠封装技术,增大了单位芯片的容量的同时,还采用了温度补偿自刷新、温度补偿自动刷新和数据总线倒置技术,在降低功耗方面起到了很好的效果。
另外DDR4增加了DBI、CRC、CA parity等功能,让DDR4内存在更快速与更省电的同时亦能够增强信号的完整性、改善数据传输及储存的可靠性。
从DDR到DDR3,每一代DDR技术的内存预取位数都会翻倍,前三者分别是2bit、4bit及8bit,以此达到内存带宽翻倍的目标。不过DDR4在预取位上保持了DDR3的8bit设计,因为继续翻倍为16bit预取的难度太大,DDR4转而提升Bank数量,一个rank单元内的Bank单元数量增长至16个,每个DIMM模块最高拥有8个rank单元。
DDR5
内存技术的发展与PC市场始终相辅相成。
Intel和AMD的处理器竞争越演愈烈,内存的性能成为新的瓶颈。早在2017年,负责计算机内存技术标准的组织JEDEC就宣称将在2018年完成DDR5内存的最终标准,美光、三星等内存厂商在2018年也就开始研发16GB的DDR5产品,甚至在2019年几个厂商都已经开始逐渐量产DDR5内存。但是直到2020年7月,JEDEC才正式发布了DDR5内存的标准,而且起跳就是4800MHz,这比原先想象的要高出不少。
据JEDEC介绍,DDR5标准将提供两倍于上代的性能并大大提高电源效率。在DDR5内存标准下,最高内存传输速度能达到6.4Gbps。此外,DDR5也改善了DIMM的工作电压,将电压从DDR4的1.2V降至1.1V,能够进一步提升内存的能效表现。
DDR5可以使系统通道数再翻倍(图源:Mircon)
在内存密度方面,DDR5内存标准将允许单个内存芯片的密度达到64Gbit,这比DDR4内存标准的16Gbit密度高出4倍。如此高的内存密度,再结合多芯片封装技术,可以实现最高40个单元的堆叠,如此堆叠的LRDIMM有效内存容量可以达到2TB。
据DIGITIMES报道,三星电子、SK海力士和美光科技均已扩大其DDR5芯片产量,旨在加速行业从DDR4向DDR5的过渡。消息人士称,将2022年视为DDR5的预热年,2023年DDR5渗透率将大幅提升。
从1998年三星生产出最早的商用DDR SDRAM芯片到现在,已经过去了20多年,DRAM内存市场一直在发展,从DDR到DDR2、DDR3、DDR4、DDR5,然后是正在研发的DDR6。
从DDR技术和JEDEC规范的演进过程中,我们可以看到,为了配合整体行业对于性能、内存容量和功耗的不断追求,规范的工作电压越来越低,芯片容量越来越大,IO的速率也越来越高。
从最早的128Mbps的DDR发展到了当今的6400Mbps的DDR5,每一代DDR的数据速率都翻倍增长。
根据Yolle分析,两代内存之间的过渡时间大概只需要两年。这意味着到2023年,DDR5 内存的市场份额将高于DDR4的情况,到2026年,DDR4份额应降至5%以下。整个DRAM市场预计到2026年将达到2000亿美元。
DRAM的分支与演进
按照应用场景,DRAM分成标准DDR、LPDDR、GDDR三类。JEDEC定义并开发了这三类标准,以帮助设计人员满足其目标应用的功率、性能和尺寸要求。
标准型DDR:针对服务器、云计算、网络、笔记本电脑、台式机和消费类应用程序,允许更宽的通道宽度、更高的 密度和不同的外形尺寸;
GDDR:Graphics DDR,一般称之为显存,“G”代表Graphics,顾名思义,GDDR就是针对图形显示卡所特化的一种DDR内存。2000年后电脑游戏的发展和火爆,人们对于显卡性能需求日益增长。运行电脑游戏对显卡GPU有高速数据交互需求,而且GPU与显存之间的数据交换非常频繁,特别是3D游戏的纹理贴图对显存带宽和容量的要求更高。因此,GDDR应运而生,GDDR适用于具有高带宽需求的计算领域,例如图形相关应用程序、数据中心和AI等,与GPU配套使用;
LPDDR:Low Power DDR,是DDR SDRAM的一种,又称为 mDDR(Mobile DDR SDRAM),是JEDEC固态技术协会面向低功耗内存而制定的通信标准,以低功耗和小体积著称,提供更窄的通道宽度,专门用于移动式电子产品。
DDR、GDDR、LPDDR,分别作为电脑、显卡、手机的内存,都有各自耕耘和专攻的领域,尽管类型多种多样,但万变不离其宗,都是基于DDR的一些原理演变而来。
但从不同类型内存发情况来看,它们目前包括以后的关系将不再是继承发展而是平行发展的关系。DDR将继续稳步的走性能路线,而GDDR也更加专注对带宽和容量的优化,至于移动端的扛把子LPDDR近年来市场需求旺盛,技术迭代压力大,有望继续领跑。同时,三种内存上所采用的新技术也可反哺DDR家族,为它们各自的的发展提供借鉴和技术验证。
另外,对于迫切需要高带宽的应用,比如游戏和高性能计算,高带宽内存(HBM)成为绕过DRAM传统IO增强模式演进的优秀方案。
高带宽内存(HBM)
HBM直接和处理器封装的方式不再受限于芯片引脚,突破了IO带宽的瓶颈。另外DRAM和CPU/GPU物理位置的接近使得速度进一步提升。
在尺寸上,HBM也使整个系统的设计大大缩小成为可能。目前,HBM2在很大程度上是GDDR6的竞争对手。不过从长远看,因为2D在制造上接近天花板,DRAM仍有很强的3D化趋势。
DDR市场格局与国产进展
高资金壁垒、高技术壁垒促使DRAM供应端形成寡头垄断市场。存储芯片的设计与制造产业具备较高的技术壁垒和资本壁垒,早期进入存储器颗粒领域的头部企业具备显著的竞争优势。同时随着晶圆制程的不断提升芯片设计和研发的难度持续提升,晶圆制造产线的投资额也随之增长,IDM 模式的存储芯片企业资本支出高企。
历经几十年间的多轮行业周期与技术变革后,存储芯片市场形成了寡头垄断格局,市场被韩国和美国的龙头企业主导。从DDR内存芯片市场来看,三大巨头三星、SK海力士、美光技术存在领先优势,据统计数据,三大巨头2021年市占率合计占比超90%。中国台湾存储企业华邦及南亚科技,大陆存储企业长鑫存储为技术追赶者。
目前市场上具备DDR5/LPDDR5量产能力的仅为三星、海力士、美光。国内存储龙头合肥长鑫存储计划于2022Q1进行DDR5的试量产。长鑫存储于2016年成立,为业内追赶者,发展较为迅速。长鑫存储于2019年9月发布自主研发的8Gb DDR4芯片正式量产,采用19纳米工艺打造。2020年长鑫存储的DDR4及LPDDR4(X)已入市,主要用于国产的PC/手机端,性能获得市场的认可、价格具备市场吸引力。
有消息称,长鑫存储今年还将投产17nm工艺的DDR5内存,未来还会有10G5工艺和DDR6的升级,可见我国在内存芯片领域正在加速追赶,未来在这一领域或将不再受限于国外垄断。
此外,芯动科技近日也在LPDDR5X领域率先突破10Gbps,以先进FinFet工艺量产全球最快LPDDR5/5X/DDR5 IP一站式解决方案。除了速度的提升,延迟也降低了15%,非常适合5G通信、汽车高分辨率AR/V、AI边缘计算等应用场景。
除了LPDDR5/5X/DDR5,近期芯动科技还正式发布了全球首款GDDR6X高速显存技术,首发的GDDR6/6X Combo IP,单个DQ能达到21Gbps超高速率,已经在多个先进FinFet工艺成功量产出货。芯动科技还率先推出自主研发物理层兼容UCIe标准的IP解决方案Innolink Chiplet,这是首套跨工艺、跨封装的Chiplet连接解决方案,且已在先进工艺上量产验证成功。
值得一提的是,今年5月,国内又一家科技公司澜起科技正式宣布,已成功首发试产面向DDR5内存的第二代RCD芯片。RCD芯片是一种缓冲器,位于内存控制器和DRAM IC之间,可以重新分配模块内的命令/地址信号,从而提升信号完整性并将更多内存设备连接到一个DRAM通道。
另外,澜起科技还发布了全球首款CXL内存扩展控制器芯片MXC,该芯片可大幅扩展内存容量和带宽。之后不久,三星电子发布首款512GB内存扩展器DRAM模组,该内存模组的CXL内存扩展控制器芯片就是采用了澜起科技的MXC。
财信证券表示,高流量应用场景的逐步落地要求更高的服务器性能,而处理器厂商陆续推出新平台标志DDR5开始取代DDR4,这将带来内存接口芯片单价的提升,同时配套芯片的引入也会带来增量空间。
从1971年英特尔发明第一块DRAM开始,这个产业起起伏伏发展了50多年。DRAM行业领头羊也从美国换到日本,如今花落韩国。
毫无疑问,随着国产DDR5内存的诞生,市场竞争还会进一步加强。
在过去十几年,韩国统治了内存市场,但对未来的情况谁都无法预测。长鑫存储用6年追到只差三星1-2代,也许再用5年就能完全追平三星。
毕竟,所有燎原的大火都起源于一粒火种。