Huawei AI-Solver Group
Huawei AI-Solver Group
新闻
研究论文
成员
联系
Hong Yankun
Latest
SVDq: 1.25-bit and 410x Key Cache Compression for LLM Attention
Cite
×