参数减少99.5%,媲美全精度FLUX!字节跳动等发布首个1.58-bit FLUX量化模型
社区头条 热门内容榜 • TOP6 文章链接:https:arxiv.orgpdf2412.18653项目链接:https:chenglinyang.github.io1.58bit.flux.github.iogit主页:https:github.comChenglinYang亮点分析1.58bitFLUX,第一个将FLUX视觉Transformer的参数(共119亿)减少99.5%至1.58bit的量化模型,无需依赖图像数据,大幅降低存储需求。开发了一个高效的线性内核,针对1.58bit计算进行了优化,实现了显著的内存减少和推理加速。证明了1.58bitFLUX在具有挑战性的T2I基准测试中,...