元脑KOS再献力！向Mooncake社区合入CXL存储高级特性，支持KV Cache到CXL内存零拷贝

2026-04-02

继向Mooncake社区贡献CXL存储基础功能特性（PR #1365），实现Put/Get、BatchPut/BatchGet等标准接口的CXL适配，让上层应用可透明启用CXL存储KVCache后，元脑KOS团队再进一步—— 完成CXL存储高级特性的代码合入。本次合入实现了基于CXL的零拷贝接口、支持了CXL内存使用率监控功能、并完成了CXL内存驱逐（EVICT）机制的验证，推动了Mooncake社区在CXL存储特性上从基础接口落地到高级功能扩展的关键演进，进一步筑牢了Mooncake原生支持CXL的技术基石，为AI大模型长上下文、高并发推理场景提供更可靠的KVCache存储支撑。

元脑KOS向Mooncake社区开源共建CXL存储高级特性技术概念图

筑牢基础功能，构建高级特性，助力CXL存储效能与稳定性双突破

作为主流的分布式KVCache存储引擎，Mooncake凭借分布式、多层级的存储架构，成为大模型推理的重要底层基础设施。此前，元脑KOS团队提交的第一阶段PR，完成了CXL存储基础接口的开发，让Mooncake框架首次原生支持CXL内存介质，实现了基础的KVCache数据读写能力，为后续CXL存储高级功能的完善打下了基础。

在第二阶段，元脑KOS团队继续深耕MooncakeCXL存储的高级特性，一是实现基于CXL的Mooncake零拷贝高性能接口，以满足实际业务中大规模、高并发数据的传输需求；二是实现CXL内存场景下驱逐（EVICT）机制，基于LRU策略，实现对CXL内存中低频数据的淘汰，确保CXL内存水位维持在可控范围，进一步提升系统的稳定性。

元脑KOS团队通过实现上述高级功能，使Mooncake在CXL内存上的潜能被进一步激发，从而推动Mooncake CXL存储从基础功能使能到高级特性跃迁的关键演进。

元脑KOS贡献进阶成果高级特性落地推动CXL存储效能与稳定性的双重跃升

本次代码合入重点落地了CXL零拷贝高性能接口和CXL内存驱逐（EVICT）机制高级特性，具体贡献如下：

■实现CXL零拷贝接口，推动KV Cache读写性能的进一步提升

本次开发实现了CXL零拷贝接口（get_into/put_from）及批量零拷贝接口（batch_put_from/batch_get_into），通过了测试验证，确保了其在CXL存储场景下的正确性与兼容性。零拷贝功能的核心优势在于：通过消除数据传输的中间缓冲区，避免冗余的数据搬运，让数据可以直接在源内存与CXL内存之间高效流转，有效降低传输延迟；上层应用仅需基于Mooncake标准API进行调用，业务代码零侵入，即可提升CXL存储场景下KVCache数据的读写效率。

基于零拷贝接口的CXL存储架构

■ 实现CXL内存驱逐（EVICT）机制，为系统稳定运行提供坚实支撑

为保障CXL存储场景下持续写入数据时系统长期稳定运行，元脑KOS团队实现CXL内存驱逐（EVICT）机制，当数据达到阈值时，系统将根据元数据中维护的租约（Lease）信息，按照不同的访问热度划分KV Cache数据，通过LRU机制，选择低频访问的KV Cache数据进行驱逐，确保CXL内存水位维持在可控范围内，保障整体系统性能稳定。

通过本次贡献，元脑KOS团队重点实现了零拷贝传输与内存驱逐（EVICT）机制两项高级特性，使Mooncake在CXL内存介质上具备高效数据流转与动态资源调度的能力，不仅带来了KV Cache读写性能的进一步跃升，而且也保证了CXL存储特性在生产环境中的可靠稳定。

进一步深度融合为Mooncake生态注入新动能

本次代码合入实现了Mooncake CXL存储的高级特性，从技术、应用、生态三个维度释放价值：

■技术层面：实现了Mooncake CXL存储零拷贝功能和内存驱逐（EVICT）机制，带来了读写效能与系统稳定性的双重跃升。

■应用层面：在保证深度释放CXL存储能力的同时，实现接口解耦，上层应用无感知的情况下即可使用CXL的高效存储能力，进一步降低应用的适配难度。

■生态层面：为Mooncake社区提供了可直接复用的成熟CXL存储方案，加速CXL技术在Mooncake生态的落地与普及。

推进分级存储技术能力进一步深化CXL存储效能

此次CXL存储高级功能的代码合入，是元脑KOS团队推进Mooncake原生支持CXL技术的第二阶段核心成果，标志着Mooncake与CXL存储的深度融合，为团队后续的技术演进路径奠定了基础。按照规划，团队接下来将聚焦DRAM-CXL-SSD分级存储功能，重点完成分配策略优化、Client多协议支持以及冷热数据升降级等核心工作，持续推动以内存为中心的跨节点共享存储技术创新，进一步深化CXL存储效能。

浪潮信息与Mooncake社区围绕CXL+AI的持续深耕，为生态伙伴带来实质价值：对Mooncake社区而言，本次贡献使Mooncake成为首个具备CXL存储高级特性生产级KVCache存储引擎，为社区开发者提供开箱即用CXL存储能力，降低基于CXL内存介质构建KVCache存储系统的适配门槛，为CXL内存在大模型推理场景中的规模化落地提供了功能完备、稳定可用的基础设施支撑。对AI Infra生态而言，本次贡献在首个PR的基础上，进一步实现了零拷贝接口与内存驱逐（EVICT）机制，使CXL存储方案进一步提升了数据读写性能与系统稳定性，助力CXL在AI Infra领域的应用落地，为行业提供了更加成熟、可靠的多元化技术选择。

未来，浪潮信息将持续投入AI基础软件开源，将KOS内核优化能力反哺社区。在此，诚挚邀请更多开发者关注Mooncake项目，参与CXL生态建设，共同推动AI基础设施的技术革新。

本文技术细节基于浪潮信息向Mooncake社区提交的开源代码，相关PR已合入主分支。

「开源地址」

🙋欢迎访问Mooncake GitHub仓库：https://github.com/kvcache-ai/Mooncake了解详情！

上一篇：不重启，广覆盖：eBPF封堵高危提权漏洞

下一篇：元脑KOS发布异构推理加速器，CPU+GPU资源动态调度提升推理效率

返回列表

元脑KOS再献力！向Mooncake社区合入CXL存储高级特性，支持KV Cache到CXL内存零拷贝

筑牢基础功能，构建高级特性，助力CXL存储效能与稳定性双突破

元脑KOS贡献进阶成果 高级特性落地推动CXL存储效能与稳定性的双重跃升

推进分级存储技术能力进一步深化CXL存储效能

元脑KOS贡献进阶成果高级特性落地推动CXL存储效能与稳定性的双重跃升