Pu (Luke) Yi, Yifan Yang, Chae Young Lee, Sara Achour
Stanford University
ASPLOS 2025
Presenter: wzw
Date: 2026-04-27
12.18x speedup。distance gap 或 absolute similarity 作为 confidence metric,本质仍是 经验阈值。$$ Z_n(D) = \frac{1}{n}\sum_{i=1}^{n} D[i] $$

Figure 1 给的是 language classifier: input 先被 encoder 映射成 query hypervector,再和多个 class hypervector 比距离。
cand = argmin(dist),并与其余类别逐一做显著性检验。S_n = sqrt(n) * gap / sqrt(CD_n - gap^2)p-value: W_n = 1 - Phi(S_n)$$ p_i < \frac{\alpha}{j} $$
iid;但对 OnlineHD / LeHDC / LDC 这类 learned hypervector,独立性往往被破坏。| Baseline | Encode | Distance | Stat Tests | Total |
|---|---|---|---|---|
| Unoptimized | 243.40 | 0.10 | - | 243.50 |
| Omen $\alpha=5\%$ | 77.67 | 0.04 | 0.59 | 78.30 |
OHD-BSC-ucihar 上,statistical tests 只占总时延约 0.76%。LDC-BSC, N=256:维度太短、且统计检验含 floating-point ops,优化空间被明显压缩。lang / ucihar / isolet / mnist 四类 edge-friendly classification。OnlineHD / LeHDC / LDC,再配合 BSC / MAP 变体,总计 19 benchmarks。10048 / 5056 / 256;termination 配置分别为 512/64、512/64、16/4。STM32U585AI MCU 上跑;大 MAP 模型转到桌面 i9-13900K 单线程执行。DIFF / ABSOLUTE / MEAN / Smaller Vector,覆盖主流 heuristic family。
1.08-7.21x1.24-10.04x1.41-12.18xLDC-BSC,因为 N=256 太短,能裁剪的冗余本来就少。0.0-0.6%;其中 13 个 benchmark 是 0% loss。0.0-2.4%,且比 SV 少 0.8-7.2% loss。
SUR = 1.187 * DRR - 0.483。
LDC-BSC 噪声实验里,$\alpha=5\%$ 仍有 1.07-2.19x reduction,accuracy drop 仅 0.3-1.4%。Wald + Holm-Bonferroni + CD precompute 让保证不是停留在纸面上。energy / EDP,说服力会更完整。it/ct,这层 policy 本身还可以继续优化。