<aside> 💡

将量化难度从激活迁移到权重

</aside>

论文

背景[1]

以上是大模型量化困难的原因,总结下来就三点:

8ip4j1aj.bmp

bwisoy61.bmp

SmoothQuant 技术原理[1]

757uxdgw.bmp