经典的SRAM存储单元由六个晶体管构成,即所谓的6T bitcell。这种结构看似简洁,却隐藏着一个先天缺陷——读取与写入操作对晶体管性能的需求相互冲突。访问晶体管与存储晶体管之间存在微妙的博弈关系:当几何尺寸越缩越小,工艺波动对bitcell读写特性的影响就越显著。
到了先进节点,静电控制和随机掺杂变异成为主要制约因素。更棘手的是,尽管晶体管尺寸在缩小,导线的电阻和位线的寄生电容反而呈现上升趋势,而供电电压(Vdd)却几乎没有随节点等比例下降。逻辑电路尚可通过器件结构创新和布线优化继续推进,但SRAM的缩放之路已经步履维艰。
每次工艺节点演进,同等容量SRAM占用的芯片面积比例反而上升。越来越多的芯片设计已经触及光刻机的掩模版极限(reticle limit),迫使厂商不得不依赖速度慢得多的片外存储。而片外DRAM的访问延迟比片上SRAM高出几个数量级——这不是设计缺陷,而是物理规律使然。
开发者需要更加注重数据局部性优化、内存感知的任务调度、模型量化、稀疏计算以及分层内存管理。因为单纯依靠算力提升,已经无法抵消SRAM缩放停滞带来的性能损失。