微博
加入微博一起分享新鲜事
登录
|
注册
140
打破压缩极限!OBR让大模型同时实现W4A4KV4量化+50%剪枝,LLM性能逼近FP16带来4.72×加速 @今天看啥hello http://www.jintiankansha.me/t/aOTL0rrFs8
请登录并选择要私信的好友
300
打破压缩极限!OBR让大模型同时实现W4A4KV4量化+50%剪枝,LLM性能逼近FP16带来4.72×加速 @今天看啥hello http://www.jintiankansha.me/t/aOTL0rrFs8
已选择
0
张,还能选择
1
张
来自
今天看啥Hello
赞一下这个内容
公开
分享
获取分享按钮
正在发布微博,请稍候