存储进入“长牛”通道:缺货与涨价成主旋律
中信证券最新研究旗帜鲜明地指出,Agent AI引发的算力重构,正在把“存力”推向半导体舞台中央。AI推理端Token消耗呈指数级膨胀,KV Cache容量随序列长度线性放大,导致市场出现结构性硬缺口;而原厂扩产节奏滞后18–24个月,供需错配至少延续至2027年,DRAM与NAND价格2026全年预计维持单边上涨。
CFMS 2026风向标:产业链共话“穿越周期”新解法
3月底召开的深圳闪存峰会吸引三星、铠侠、Solidigm、英特尔、腾讯云等巨头同台,议题锁定PCIe 6.0 SSD、QLC大容量方案与AI存算协同。现场展出逾百款新品,一致指向“把数据留在闪存、把算力拉向终端”的技术路线,为存储价值重估写下注脚。
AI服务器占比突破两成,eSSD跃居NAND最大下游
CFM数据显示,2026年全球服务器出货量同比增15%,AI服务器渗透率将首次跨过20%门槛;当单请求上下文从1k Token放大到128k,KV Cache占用可由0.5GB飙升至64GB。HBM需求在2025、2026年分别预增90%与35%,而KV Cache下沉叠加企业级硬盘缺货,推动eSSD份额升至37%,成为NAND第一大应用市场。
高端DRAM产能挤压成熟制程,库存跌破安全线
原厂将优先产能分配给HBM、DDR5、LPDDR5X/6等高利基产品,预计2026年高端DRAM产能占比将突破85%,传统消费级颗粒持续被挤占,行业库存已降至4周历史低位。慧荣科技直言,真正的“缺货顶点”或出现在2027年。
“Token工厂”重塑价值链,模组厂向客制化高毛利转型
英伟达提出“Token工厂经济学”,明确存储是AI基础设施盈利杠杆。eASP价格已达消费级NAND两倍以上,原厂忙于介质升级,方案商则凭自研主控切入企业级定制市场,竞争焦点从低价抢单转向稳定供货与增值设计。
云端:QLC百TB级方案+PCIe 6.0,释放GPU集群潜能
为满足十万卡级集群的带宽与延迟需求,铠侠、大普微、闪迪等推出245–256TB QLC eSSD,把每GB成本拉至新低;三星PM1763、FADU“Lhotse”主控率先冲进PCIe 6.0,顺序读速高达28.5GB/s,配合液冷散热,实测可将首Token生成时间缩短41倍。
终端:端侧AI倒逼“存算融合”,DRAM占用最高降50%
AI PC、智能座舱与AIoT对功耗、BOM极度敏感。江波龙5nm SPU、群联Hybrid AI SSD通过主动缓存调度,把部分推理负载迁移至NAND,可在256K上下文场景下减少40–50% DRAM用量;车厂正推动由域控走向中央池化,LPDDR6与车规大容量UFS呼之欲出。
风险提示与投资机会
需警惕全球经济波动、云厂商资本开支放缓及地缘贸易摩擦。赛道高景气下,中信证券优先推荐:1) 具备现货渠道与价格弹性的存储模组厂商;2) 直接受益缺货涨价、产能满载的原厂及紧密配套的设计公司。