NEWS LETTER

现有近数据处理(NDP)芯片架构的算力与带宽数据调研

Scroll down
Other Articles
Article table of contents TOP
  1. 1. 1. 引言:大语言模型时代的访存墙危机与NDP/PIM架构的崛起
  2. 2. 2. Roofline性能模型在LLM算子分析中的理论框架
    1. 2.1. 2.1 算术强度的数学定义与Roofline拐点特征
    2. 2.2. 2.2 典型算子分析:GEMM(预填充阶段)与GEMV(解码阶段)的算力需求断层
  3. 3. 3. 现有主流近数据处理(NDP)与存内计算(PIM)芯片架构的深度剖析
    1. 3.1. 3.1 三星 Aquabolt-XL (HBM2-PIM):基于HBM架构的行级并行计算突破
    2. 3.2. 3.2 SK海力士 GDDR6-AiM:面向边缘与高性能计算的高性价比BF16加速方案
    3. 3.3. 3.3 阿里巴巴达摩院 HB-PNM:基于3D混合键合工艺的超高互连带宽架构
    4. 3.4. 3.4 UPMEM PIM:基于标准DDR4 DIMM的通用可编程存内计算架构
    5. 3.5. 3.5 新一代架构演进:PIM-AI与大模型专属设计
  4. 4. 4. NDP芯片架构算力、带宽数据与Roofline拐点特征总结
    1. 4.1. 4.1 核心数据结构化总结
    2. 4.2. 4.2 Roofline拐点(Ridge Point)的计算与对比分析
  5. 5. 5. 基于Roofline模型的数据驱动分析:NDP架构在LLM推理中的适用性
    1. 5.1. 5.1 为什么NDP架构不适合GEMM(计算受限阶段)
    2. 5.2. 5.2 为什么NDP架构是GEMV(访存受限阶段)的理想选择
  6. 6. 6. 2024-2025年前沿研究:软硬件协同设计与异构PIM系统架构
    1. 6.1. 6.1 NeuPIMs与AttAcc:NPU-PIM的深度异构融合
    2. 6.2. 6.2 HPIM:SRAM-PIM与HBM-PIM的多层级架构设计
  7. 7. 7. 架构设计的二阶与三阶深层洞察
    1. 7.1. 7.1 3D封装的物理与热力学约束:为何PIM无法追求高主频
    2. 7.2. 7.2 编程模型与编译器生态的鸿沟:从冯·诺依曼到数据为中心
    3. 7.3. 7.3 存储器市场的碎片化与领域定制化趋势
  8. 8. 8. 深度研判与结论
Please enter keywords to search