2026.03.31
SPU(存储处理单元)
SPU,全称为Storage Processing Unit,中文译为存储处理单元,是AI应用时代的存储智能硬件(WM8500 5nm芯片),由半导体存储品牌企业江波龙率先提出并推动,旨在打破传统存储控制器仅负责数据搬运的局限,推动存储产业从被动式数据仓库向主动式智能数据处理节点演进。
SPU 集成存储控制引擎与智能处理引擎,核心使命是从 “单纯搬运数据” 升级为 “理解、压缩、智能调度数据”,是存储智能体(iSA)的专属硬件运行平台,与 iSA 形成“硬件执行 + 软件决策”的协同架构,共同解决端侧 AI 时代的内存墙、成本高、模型规模受限等行业痛点。
一、核心定义与定位
1. 什么是 SPU?
SPU(Storage Processing Unit,存储处理单元)是 AI 时代的新型存储控制硬件,采用超融合芯片架构,集成存储控制引擎与智能处理引擎,在保障基础数据读写传输的同时,实现数据的智能感知、压缩、调度与处理,无需额外硬件即可平衡容量、性能与成本,是存储智能体的硬件载体。
2. SPU 与常规 SSD 控制器的核心区别
过去三十年,常规 SSD 控制器核心仅为快速、稳定、低成本搬运数据,SATA、NVMe、TLC、QLC 等技术迭代均围绕此核心;
SPU 突破传统定位,不仅完成数据搬运,还可主动感知数据温度、适配工作负载节奏,实现数据智能处理与调度,是存储从被动到主动的核心变革。
3. AI 时代需要 SPU 的核心原因
AI 与端侧智能时代,存储需求从 “追求带宽和 IOPS” 升级为智能、高效、降本:
· 大模型数据规模指数级增长
· 端侧设备对功耗、成本高度敏感
常规 SSD 控制器仅能搬运数据,无法满足 “理解数据、智能调度” 需求,SPU 是适配 AI 时代的存储核心解决方案。
4. SPU 核心技术架构
SPU 采用超融合双引擎集成架构:
· 存储控制引擎:负责基础数据读写、传输,保障数据搬运的高速与稳定;
· 智能处理引擎:负责数据压缩、冷热识别、负载适配、智能调度等智能操作;
双引擎协同实现 “存储主控 + 智能处理” 一体化,无需额外硬件支持。
二、核心技术与创新特性
(一)存内压缩技术
1. 技术优势
SPU 内置硬件级存内压缩引擎,具备性能零损耗、压缩效率高的特点,压缩和解压在 SPU 内部完成,对主机端完全透明,不影响读写延迟与主机性能;平均压缩比可达2:1,实现小容量盘有效带宽翻倍,码率范围增加 10%,延长闪存寿命。
2. 用户价值
直接实现降本增效:单位 GB 存储成本显著降低,例如 64TB SSD 通过存内压缩可提供 100~128TB 有效容量,无需增加硬件即可满足 AI 海量数据存储需求,同时无性能损耗。
(二)超大容量支持
1. 容量规格
基于 SPU 架构的主控芯片,单颗可支持最大 128TB 存储容量,全面适配 AI 时代数据爆发需求。
2. 行业意义
当前主流 cSSD 最大容量仅 8TB,大容量 eSSD 方案成本高企;SPU 有效平衡容量与成本难题,可高效益替代 HDD,为客户 eSSD 方案提供新路径,降低整体拥有成本(TCO)。
(三)HLC 高级缓存技术
1. 技术定义
HLC(High Level Cache)高级缓存是 SPU 战略级创新,通过主控、固件与系统架构协同优化,让 SSD 承接原本由 DRAM 负责的温冷数据缓存工作,实现SSD 作为 DRAM 的延伸,而非简单替代 DRAM。
2. 解决行业痛点
传统架构中 DRAM 成本高、功耗敏感,是 AI PC、具身智能等终端产品的核心成本项;
HLC 技术可在保证流畅体验的前提下,减少整机 DRAM 用量,显著降低终端产品 BOM 成本,是系统级成本优化方案。
(四)Hybrid NAND 智能调度
1. 技术原理
传统存储需在 TLC(高速高成本)与 QLC(低成本低速)中二选一;
SPU 通过智能混合调度算法,动态分配 NAND 资源:热数据走 TLC/pSLC 高速缓存区保障性能,冷数据沉入 QLC 大容量区控制成本,实现同一块 SSD 内高性能与低成本的最优平衡。
2. 核心依赖
依赖 SPU 智能处理引擎与专属数据调度算法,根据数据冷热、负载变化自动调整,无需人工干预。
三、应用场景
1. 核心聚焦场景
SPU 主要面向存储智能体、KV Cache、HDD 升级替代三大核心场景,精准匹配 AI 时代存储需求。
2. 端侧智能场景优势
端侧 AI 设备面临功耗、空间、成本、数据量多重限制,SPU 通过:
· 存内压缩提升有效容量
· HLC 技术降低 DRAM 依赖与成本
· 低功耗架构适配端侧需求
在有限资源内实现海量数据高效处理,是端侧智能的理想存储核心。
3. AI PC 核心解决方案
AI PC 对本地大模型运行、AIGC 创作有高存储要求,SPU 凭借:
· PCIe 5.0 高速接口带宽
· HLC 技术降低整机成本
· 存内压缩提升有效容量
完美匹配 AI PC 爆发式存储需求,成为 AI PC 时代的存储智能硬件。
4. 基于 SPU 的 AI SSD 优势与适配场景
基于 SPU 打造的 AI SSD 具备三大核心优势:
1. 高速低延迟 HLC 缓存,保障 AI 数据读写流畅性
2. 降低终端 DRAM 用量,显著降低整机 BOM 成本
3. 存内压缩、智能调度优化本地大模型推理与 AIGC 体验
适配场景:AI PC、具身智能终端、高性能工作站等,是 AI 场景核心存储载体。
四、iSA(存储智能体)——SPU 软件大脑
(一)iSA 核心定义
iSA,全称为Intelligence Storage Agent,即存储智能体,是专为端侧 AI 推理场景打造的存储智能调度引擎,也是 SPU 的软件大脑。
针对 MoE 大模型参数膨胀、KV Cache 激增、I/O 延迟制约推理等挑战,iSA 通过 MoE 专家卸载、KV Cache 智能管理、Device Smart Prefetch 预取算法,与 SPU 硬件深度协同,突破端侧内存瓶颈,实现大模型终端高效流畅运行。
(二)iSA 与 SPU 的核心关系
· SPU(执行层):硬件核心,负责数据存储、硬件压缩、高速缓存执行;
· iSA(决策层):软件大脑,负责 MoE 专家参数卸载策略、KV Cache 生命周期管理、智能预取调度决策;
两者形成软件决策 + 硬件执行闭环:iSA 感知 AI 推理负载并制定策略,SPU 依托 HLC 与存内压缩快速执行,是突破端侧内存墙、提升模型规模上限的核心架构。
(三)iSA 核心技术与功能
1. Expert Offloading(专家管理器)
专为 MoE 混合专家模型设计,利用 MoE 稀疏激活特性:
· 实时追踪 Expert 激活状态,将超 50% 的冷专家权重卸载至 SPU 高速缓存
· DRAM 仅保留活跃 Hot Expert
· 冷专家被路由时协同 SPU 低延迟回填
效果:同等 DRAM 配置下,可部署模型参数规模提升 3 倍以上。
2. Device Smart Prefetch(智能预取算法)
解决端侧 AI 推理 I/O 与计算时序错位痛点:
· 分析 token 生成节奏与专家路由规律
· 提前预判下一批激活 Expert 与 KV Cache 需求
· 向 SPU 下发异步预取指令,将数据提前搬运至 DRAM
· 完全隐藏 I/O 延迟,实现零等待推理
3. 存储调度器与 KV Cache 管理器
· 存储调度器:与 SPU 协同感知负载变化,动态划分高速缓存与普通存储区间,最大化缓存利用率;
· KV Cache 管理器:针对 KV Cache 膨胀特性实施分层卸载,活跃 KV 保留 DRAM,历史 KV 卸载至 SPU 并压缩,延长有效上下文窗口,避免溢出崩溃。
(四)SPU 与 iSA 协同实测数据
江波龙与 AMD 基于锐龙 AI Max+ 395 处理器的智能体主机开展联合调优,实测成果:
1. 成功实现397B 超大模型本地部署;
2. 在 **256K 超长上下文(122B)** 场景下,DRAM 占用降低近 40%;
3. 搭配 HLC 高速存储,进一步释放端侧 AI 性能,为超大模型本地化部署提供创新方案。
(五)协同应用价值与场景
1. 核心价值
赋能端侧 AI,降本增效:
· 提升端侧 AI 模型运行效率与规模上限
· 降低终端 DRAM 配置成本
· 解决端侧 AI“内存不足、模型受限、成本偏高” 核心痛点,推动本地 AI 普及。
2. 核心适配场景
· AI PC:本地大模型推理、AIGC 创作、科学计算;
· AI 智能体主机:大型 AI 模型训练、复杂 AI 任务处理;
· 具身智能终端:人形机器人、自动驾驶终端等,在有限功耗内存下保障 AI 决策响应。
3. 对终端厂商的意义
实现降本 + 提效双重收益:
· 无需大幅提升 DRAM 即可支持更大模型,降低整机 BOM 成本
· 提升 AI 运行流畅度,增强终端产品核心竞争力
· 适配 AI 时代终端产品升级趋势
五、行业价值与未来意义
1. 对存储行业的核心价值
SPU 重新定义 AI 时代存储芯片:
· 打破常规 SSD 控制器 “数据搬运工” 定位
· 存储从 “被动搬运” 升级为 “主动智能处理”
· 为存储智能体提供专属硬件平台
· 推动存储行业从容量 / 性能竞争进入智能效率竞争新阶段。
2. 核心竞争力(技术亮点汇总)
· 架构:超融合双引擎(存储控制 + 智能处理)集成;
· 工艺:5nm 工艺,搭配 PCIe 5.0 高速接口;
· 智能能力:存内压缩(平均 2:1)、HLC 高级缓存、Hybrid NAND 智能调度;
· 容量:单颗支持 128TB 超大容量,可升级替代 HDD。
上一条 MemoryS 2026|江波龙首发SPU及iSA,端侧AI存储创新布局八大看点分享 2026.03.30
手机:+86-13510641627
微信:Longsys_electronics
邮箱:marcom@longsys.com