本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。
随着人工智能的爆炸式增长,其对算力的要求也越来越高。
Nature最新一期,就连登了两篇光学加速AI计算的论文,里面介绍了两个AI计算加速器:分别是11TOPS的光子卷积加速器和张量核光子加速器,两者都可以达到每秒数万亿次的计算速度。
光子处理器利用光的特性,可以加速人工智能计算处理过程,同时,还会引领光子计算的复兴。
为何光子计算能加速AI?
由于光谱覆盖的波长范围很广,不同波长的光子可以进行多路传输或者平行传输,光信号之间而相互干扰,还能够进行调整,改变传输方式,携带更多的信息。
所以在过去几十年中,光纤通信取得了巨大成功。
但是,光子计算跟SOTA水平的电子计算处理器相比,还是有着很多不足,比如缺乏合适的并行计算机制、人工神经元的高速非线性响应的材料和可扩展的光子设备,这些都难以让光子计算快速准确地集成到计算硬件中。
幸运的是,光梳的发展为集成光子处理器带来了新的机遇。所谓的光梳是一组发射光谱的光源,它们由数千或数百万条在频率上均匀紧密排列的尖锐光谱线组成。
光梳在光谱学、光时钟计量学和远程通信等领域取得了巨大成功,因此获得了2005年诺贝尔物理学奖。
光梳还能集成到计算机芯片中,用作光计算的节能能源,给光子计算的增速带来了曙光。
在光梳的基础上,他们创造出了这两个AI加速器。
11TOPS的光子卷积加速器
11TOPS的光子卷积加速器是研究人员利用了光梳制造的一种多功能的光学矢量加速器。
研究者采用了巧妙的方法进行卷积运算,他们先利用色散为波长多路复用光信号产生不同的时间延迟,然后将这些信号沿着与光波波长相关的维度进行组合。
通过充分利用光子波长的广泛范围,研究者实现了不同卷积运算的并行计算,使用单个处理核心的光计算速度,只受数据吞吐量的限制,速度能达到10万亿次每秒。
运用这个加速器,每秒可以对25万像素进行卷积运算,足以进行人脸识别。
他们还使用这个加速器形成一个有10个输出神经元的光学卷积神经网络,成功地识别出不同的数字图像,准确率高达88% 。
这种方法还可以训练更复杂的模型,比如无人车、视频实时识别等。
张量核光子加速器
另外一个研究团队,展示了一个张量核光子加速器,每秒能够进行数万亿次的MAC运算。
它是一个特殊计算集成的光子硬件加速器,利用相变材料存储器阵列和基于光子芯片的光梳实现了光子存储的并行计算,还通过多种波长和相变材料的集成单元阵列进行模拟矩阵矢量乘法,使输入数据完全并行化。
高度并行化的计算框架,可以同时高效处理整个图像。将来,这个方法可以广泛用于商业制造程序和机器学习。
由于卷积过程涉及无源传输,光子处理核心的计算可以低功耗下进行,这对于像云计算这种能源密集型应用程序来说意义重大。
研究结果表明,集成式并行光子计算在自动驾驶、实时视频处理和下一代云计算服务等数据量大的人工智能应用中,可以发挥重要作用。
问题与挑战
虽然上述两者在光子计算的AI领域,取得了突破,证明了光子计算在AI领域的巨大潜能。
但是全光子计算的规模仍旧比较小。这因为计算效率受到光学元件的限制,电信号和光信号之间还要进行不断转换,所以还需要材料学、光子学、电子学不同领域的科学家协同研究工作。
还有一个发展方向就是开发非线性集成的光学计算结构,即通过集成电子电路和成百上千个光子处理器,开发出光子处理器和电子处理器的混合光电框架。
这个框架可能会给AI硬件领域带来历史性的变革。