一个 1 毫瓦的机器学习芯片可以做很多事情,不过像玩《毁灭战士》(Doom)这样充满想象力的做法却很少见。
最近几日,在旧金山举行的 2023 IEEE ISSCC(International Solid State Circuits Conference)大会上,总部位于加州欧文的 AI 芯片初创公司 Syntiant 详细介绍了他们的产品 NDP200—— 一款超低功耗芯片,主要用来运行监控视频的神经网络,并在发现重要事件时唤醒其他系统。
如下为 NDP200(Neural Decision Processor)玩《毁灭战士》的演示视频片段。
如何做到的呢?
Syntiant 使用了基于 Doom 的 AI 研究平台 VizDoom,这在 AI 研究中很受欢迎。团队使用强化学习来训练多层神经网络,其中第一层负责理解网络看到的内容,而最后一层负责采取响应行动。总的来说,这个网络由大约 60 万个参数组成。虽然没有 ChatGPT 所需的亿级规模参数,但仍然要比监听「OK, Google」这类关键短语所需的 10000 个参数强大得多。NDP200 有 640 kilobytes 的板载内存用于神经网络参数。
图源:https://www.syntiant.com/ndp200
如上展示的片段中的游戏关卡叫做「保卫圆圈」,它让玩家在一个圆形房间内移动,射击面前的怪物。IEEE Fellow、前 Syntiant 高级工程师副总裁 David Garrett 表示,在训练中,神经网络必须首先识别怪物,然后学习射击它们。在第一次杀死猎物后,系统会卸载 clip(可以理解为一种文件类型),但后来发现这不是一个好办法。因此,系统很快就学会了节省弹药。
尽管《毁灭战士》的演示非常精彩,但 NDP200 还有更多实际用途。Garrett 指出,它有能力进行人体轮廓检测,这是一项通常由更强大的处理器完成的关键任务。Syntiant 芯片可以运行人体检测,作为家庭或汽车安全系统的节能步骤。
为了展示其能源效率,Syntiant 将 NDP200 与基于 Arm Cortex A53 的处理器进行了比较,该处理器运行了 20 万个参数版本的 MobileNetV1,这是 MLPerf 用来判断系统对视觉唤醒词响应情况的测试。NDP200 每次扫描图像只使用 166 微焦耳,大约是 Arm 处理器的 1/100。因此,Syntiant 芯片每秒可以扫描 6 帧视频,而耗电量为 1 毫瓦。
这款芯片并没有那么神秘,它有一条定制的路径,数据在芯片的神经决策处理器中流动。据 Garett 介绍,它尽可能充分利用了芯片的乘法累加单元,即机器学习计算的核心,将高达每秒 9 gigabytes 的数据带宽传输到神经核心。
Garrett 不愿透露 Syntiant 下一步的技术发展,但他表示会有更多有趣的应用。他说:50 万个参数足够做出真正的好东西了。