2025年春节前夕,发布的DeepSeek-R1版本刷新了全球AI芯片能效纪录。作为开源模型,DeepSeek-R1系列模型不仅具备出色的性能,最重要的是其开发成本低廉,引发全球的热切讨论和关注。除此之外,DeepSeek还发布了名为Janus-Pro和JanusFlow的一系列开源多模态模型,参数大小从10亿到70亿不等,进一步强化了文生图的能力。
DeepSeek发布的系列模型,大幅降低了算力成本,也推动了存储技术的发展。那么,DeepSeek系列模型的发布,对存储带来了哪些影响?笔者认为,DeepSeek将给存储带来三个方面的影响。
一是高性能存储需求。首先,DeepSeek 不断迭代升级的模型本身包含大量的参数,像 DeepSeek-V2 总参数达 2360 亿,DeepSeek-V3 总参数达 6710 亿。这些参数在模型运行过程中需要实时存储和调用,对存储读写性能提出了很高的要求。由于这就需要更高性能的存储系统来提高数据读写性能,降低数据读写延迟,进而提升DeepSeek AI训练和推理的速度。 除此之外,在AI PC上进行本地化部署时,也需要高性能存储来满足推理的需求,为本地部署用户带来更好的使用体验。
二是海量数据存储需求。DeepSeek的技术依赖于海量数据的采集、存储和分析,特别是在智能客服、图像识别、自然语言处理等应用场景时,会产生大量的中间数据和结果数据,需要高性能的海量数据存储方案。此外,DeepSeek需要足够的存储空间来保存模型文件及相关依赖项。这包括操作系统、应用程序、日志记录等运行时产生的临时文件,以及训练数据和日志等大体积资料。对于较小规模的模型,如拥有7B至13B参数的模型,虽然存储空间需求相对较低,但仍需确保有足够的容量来存放这些关键文件。
三是数据存储安全和隐私保护需求。DeepSeek处理的数据通常涉及数据安全和隐私保护问题,这就需要具备更高级别的数据安全存储解决方案,例如采用支持硬件级加密的存储芯片等满足DeepSeek等AI应用对数据安全的需求,这也将会成为AI和大数据应用中的重要组成部分。
综上所述,DeepSeek的爆火在对存储性能、容量和安全等提出更高的要求,也势必推动存储技术的发展。笔者认为,在AI大模型应用的驱动下,存储技术将主要向着以下方向发展。
一)高带宽存储器(HBM)技术
凭借着高带宽、低延迟、小尺寸和高能效的优势,高带宽存储器(HBM)技术将继续在存储领域占据重要地位,并呈现出显著的技术趋势和优势。2025年,随着人工智能、大数据和高性能计算需求的增长,HBM的带宽和容量将进一步提升。预计2025年,HBM3和HBM4将成为主流,带宽可能突破2 TB/s,单颗HBM堆栈容量有望达到64GB甚至更高。在制程工艺方面,HBM将采用更先进的制程工艺,如3nm或更小节点,以提升性能和能效。同时,TSV(硅通孔)技术的优化将进一步提高堆叠密度和信号传输效率。
二)QLC技术
AI大模型应用的发展对存储容量和性能提出了更高的要求,QLC凭借着大容量、高性能成为存储的主流技术。2025年,随着制程工艺向更高节点(如100层以上3D NAND)发展,QLC的单芯片容量将显著增加,预计单颗QLC NAND芯片容量可能突破2TB甚至更高。这将进一步降低每GB存储成本,使其在大容量存储市场中更具竞争力。
与此同时,2025年,通过改进存储单元设计、引入更高效的纠错算法(如LDPC)以及优化控制器技术,QLC的写入性能和耐久性将得到显著提升。此外,缓存技术的改进(如SLC/MLC缓存分区)将进一步提升QLC的随机写入性能,使其更适用于混合工作负载。
三)CXL技术
作为一种高速互连技术,它以更高的带宽解决了数据传输难题,为人工智能提供了更快、更灵活的数据传输解决方案。CXL 1.0和2.0已为设备间高效通信奠定了基础,2025年CXL 3.0有望进一步降低延迟并提升带宽,支持更复杂的计算任务。通过改进协议栈和硬件设计,CXL将更好地满足高性能计算(HPC)和人工智能(AI)的需求。随着异构计算的普及,CXL将成为连接CPU、GPU、FPGA和加速器的关键标准。2025年,CXL将更广泛地应用于数据中心和边缘计算,支持多种加速器协同工作,提升整体计算效率。
在内存池化技术方面,CXL将在2025年进一步发展,允许多个处理器共享内存资源,减少冗余并提高利用率。这一技术将推动数据中心向更灵活、高效的架构演进,降低总体拥有成本(TCO)。另外,2025年CXL联盟将继续推动标准化进程,吸引更多厂商加入生态系统。随着更多兼容设备的推出,CXL的应用场景将从数据中心扩展到边缘计算和嵌入式系统,形成更广泛的技术生态。
四)SCM技术
在大模型的驱动下,SCM技术在2025年将迎来多项技术突破和发展趋势。首先,CM技术将继续突破存储密度限制,采用新型材料(如相变材料PCM、铁电存储器FeRAM)和3D堆叠技术,实现更高的存储容量。其次,通过优化控制器和接口协议(如CXL、NVMe),SCM的访问延迟将进一步降低,接近DRAM性能,同时保持非易失性特性。最后,随着PCIe 5.0/6.0和CXL技术的普及,SCM的带宽将大幅提升,满足高性能计算和实时数据处理的需求。
五) NVMe SSD
2025年, PCIe 5.0接口将成为主流,其高带宽和低延迟特性将显著提升SSD的传输效率和并发访问能力。此外,大容量和高密度存储技术将持续进步,QLC(四层单元)闪存将被更广泛地应用,以在单位空间内提供更高的存储容量。存储管理也将更加智能化,通过集成AI算法来优化数据访问模式、提高存储效率和安全性。最后,绿色节能技术也将得到更多关注,以降低NVMe SSD的能耗和碳排放,实现更环保的数据存储。
写在最后:
DeepSeek的爆火,势必推动科技圈众多技术的创新和发展。在存储领域,随着AI大模型应用的落地,不仅将推动了存储芯片需求的增长,还促进了高性能存储技术的发展、加速了存储架构的创新,并推动了计算与存储芯片的协同发展,以及加强数据安全与存储技术的紧密结合。