随着应用数据处理需求的激增, 在传统冯 · 诺依曼 (von Neumann) 体系结构中, 处理器到主存 之间的总线数据传输逐渐成为瓶颈. 不仅如此, 近年来兴起的数据密集型应用, 如神经网络和图计算 等, 呈现出较严重的数据局部性, 缓存命中率低. 在这些新兴数据密集型应用的处理过程中, 中央处 理器到主存间的数据传输量大, 导致系统的性能不佳且能耗变高.