Wang
Zongwu
home
archives
categories
tags
Your browser does not support HTML5 video.
NEWS LETTER
现有SoC芯片NPU架构的算力与带宽数据调研及Roofline模型构建基础分析
Home
2026
Scroll down
Welcome to Zongwu's Science Hub ✨
Residence:
Shanghai
Age:
18
Contact Me
03/14
12:33
zongwu wang
请输入密码继续
Other Articles
Review
深度解析Nvidia统一内存架构-起源演进、底层机制、优劣势评估与2026年前沿进展
26/03/14
12:33
Review
现有近数据处理(NDP)芯片架构的算力与带宽数据调研
26/03/14
12:33
Article table of contents
TOP
1.
第一章:引言与计算机体系结构背景
2.
第二章:Roofline模型的基础数学理论及其在NPU架构中的深度映射
3.
核心物理量的定义与数学表达
4.
大语言模型对Roofline理论架构的冲击
5.
第三章:Apple Silicon架构算力与统一内存体系分析
6.
统一内存架构(UMA)的深刻影响
7.
苹果A系列与M系列核心性能数据详考
8.
第四章:高通Snapdragon Hexagon NPU的非线性演进与INT4量化架构
9.
突破带宽瓶颈的架构创新:Micro-tile推理与硬件级INT4量化
10.
骁龙系列Hexagon NPU算力与带宽参数详考
11.
第五章:联发科Dimensity APU的异构并行协同机制
12.
面向大模型的特定硬件加速与异构系统带宽榨取
13.
Dimensity 系列 APU 算力与内存带宽详考
14.
第六章:三星Exynos架构NPU的深层互联与先进封装破局
15.
先进封装降热阻与异构张量核心网络
16.
Exynos 2400 核心性能参数详考
17.
第七章:Google Tensor 与 TPU 脉动阵列的高效利用率哲学
18.
脉动阵列架构在Roofline模型中的表现特征
19.
边缘 TPU 与 Tensor G系列性能数据详考
20.
第八章:英伟达Jetson架构与硬件结构化稀疏的Roofline跃升
21.
结构化稀疏(Structured Sparsity)的数学奇迹
22.
Jetson 系列 SoC 算力与带宽详考
23.
第九章:华为Ascend昇腾达芬奇架构的全栈维度跨越
24.
达芬奇架构:3D Cube与分层片上存储系统的极致过滤
25.
Ascend 系列云端与边缘性能数据详考
26.
第十章:跨架构Roofline数据模型的总结与全景对比分析
27.
核心芯片架构Roofline建模关键参数一览
28.
面向未来NPU架构优化的深邃启示
Please enter keywords to search