Wang
Zongwu
home
archives
categories
tags
Your browser does not support HTML5 video.
NEWS LETTER
现有近数据处理(NDP)芯片架构的算力与带宽数据调研
Home
2026
Scroll down
Welcome to Zongwu's Science Hub ✨
Residence:
Shanghai
Age:
18
Contact Me
03/14
12:33
zongwu wang
请输入密码继续
Other Articles
Review
现有SoC芯片NPU架构的算力与带宽数据调研及Roofline模型构建基础分析
26/03/14
12:33
Review
大语言模型量化技术发展历程、演进逻辑与前沿进展调研报告
26/03/14
12:33
Article table of contents
TOP
1.
1. 引言:大语言模型时代的访存墙危机与NDP/PIM架构的崛起
2.
2. Roofline性能模型在LLM算子分析中的理论框架
2.1.
2.1 算术强度的数学定义与Roofline拐点特征
2.2.
2.2 典型算子分析:GEMM(预填充阶段)与GEMV(解码阶段)的算力需求断层
3.
3. 现有主流近数据处理(NDP)与存内计算(PIM)芯片架构的深度剖析
3.1.
3.1 三星 Aquabolt-XL (HBM2-PIM):基于HBM架构的行级并行计算突破
3.2.
3.2 SK海力士 GDDR6-AiM:面向边缘与高性能计算的高性价比BF16加速方案
3.3.
3.3 阿里巴巴达摩院 HB-PNM:基于3D混合键合工艺的超高互连带宽架构
3.4.
3.4 UPMEM PIM:基于标准DDR4 DIMM的通用可编程存内计算架构
3.5.
3.5 新一代架构演进:PIM-AI与大模型专属设计
4.
4. NDP芯片架构算力、带宽数据与Roofline拐点特征总结
4.1.
4.1 核心数据结构化总结
4.2.
4.2 Roofline拐点(Ridge Point)的计算与对比分析
5.
5. 基于Roofline模型的数据驱动分析:NDP架构在LLM推理中的适用性
5.1.
5.1 为什么NDP架构不适合GEMM(计算受限阶段)
5.2.
5.2 为什么NDP架构是GEMV(访存受限阶段)的理想选择
6.
6. 2024-2025年前沿研究:软硬件协同设计与异构PIM系统架构
6.1.
6.1 NeuPIMs与AttAcc:NPU-PIM的深度异构融合
6.2.
6.2 HPIM:SRAM-PIM与HBM-PIM的多层级架构设计
7.
7. 架构设计的二阶与三阶深层洞察
7.1.
7.1 3D封装的物理与热力学约束:为何PIM无法追求高主频
7.2.
7.2 编程模型与编译器生态的鸿沟:从冯·诺依曼到数据为中心
7.3.
7.3 存储器市场的碎片化与领域定制化趋势
8.
8. 深度研判与结论
Please enter keywords to search