Wang
Zongwu
home
archives
categories
tags
Your browser does not support HTML5 video.
NEWS LETTER
大语言模型量化技术发展历程、演进逻辑与前沿进展调研报告
Home
2026
Scroll down
Welcome to Zongwu's Science Hub ✨
Residence:
Shanghai
Age:
18
Contact Me
03/14
12:33
zongwu wang
请输入密码继续
Other Articles
Review
现有近数据处理(NDP)芯片架构的算力与带宽数据调研
26/03/14
12:33
Unclassified
🦞 OpenClaw — 个人 AI 助手
26/03/04
16:12
Article table of contents
TOP
1.
第一章 神经网络量化技术的历史溯源与理论奠基
1.1.
1.1 信息论与经典量化理论的形成
1.2.
1.2 卷积神经网络(CNN)时代的量化里程碑
2.
第二章 大语言模型(LLM)时代的量化演进与挑战
2.1.
2.1 LLM 早期量化尝试:处理激活值异常与二阶优化
2.2.
2.2 极低比特量化(1-2 bit):迈向能效极限
3.
第三章 2025-2026 年的前沿量化范式:格量化、复数域与子比特
3.1.
3.1 高维格量化(Lattice Quantization)的复兴
3.2.
3.2 复数域量化与“抬高天花板”策略
3.3.
3.3 子比特(Sub-1-bit)量化的理论突破
4.
第四章 MoE 模型、协同压缩与硬件感知设计
4.1.
4.1 混合专家模型(MoE)的量化挑战
4.2.
4.2 协同压缩与统一评估框架
4.3.
4.3 硬件感知与无乘法推理架构
5.
第五章 综合分析与技术趋势总结
Please enter keywords to search