新闻动态
当前位置:首页 > 新闻动态

元脑KOS再献力!向Mooncake社区合入CXL存储高级特性,支持KV Cache到CXL内存零拷贝

2026-04-02

继向Mooncake社区贡献CXL存储基础功能特性(PR #1365),实现Put/Get、BatchPut/BatchGet等标准接口的CXL适配,让上层应用可透明启用CXL存储KVCache后,元脑KOS团队再进一步—— 完成CXL存储高级特性的代码合入。本次合入实现了基于CXL的零拷贝接口、支持了CXL内存使用率监控功能、并完成了CXL内存驱逐(EVICT)机制的验证,推动了Mooncake社区在CXL存储特性上从基础接口落地到高级功能扩展的关键演进,进一步筑牢了Mooncake原生支持CXL的技术基石,为AI大模型长上下文、高并发推理场景提供更可靠的KVCache存储支撑。

1.png

元脑KOS向Mooncake社区开源共建CXL存储高级特性技术概念图

筑牢基础功能,构建高级特性,助力CXL存储效能与稳定性双突破

作为主流的分布式KVCache存储引擎,Mooncake凭借分布式、多层级的存储架构,成为大模型推理的重要底层基础设施。此前,元脑KOS团队提交的第一阶段PR,完成了CXL存储基础接口的开发,让Mooncake框架首次原生支持CXL内存介质,实现了基础的KVCache数据读写能力,为后续CXL存储高级功能的完善打下了基础。

在第二阶段,元脑KOS团队继续深耕MooncakeCXL存储的高级特性,一是实现基于CXL的Mooncake零拷贝高性能接口,以满足实际业务中大规模、高并发数据的传输需求;二是实现CXL内存场景下驱逐(EVICT)机制,基于LRU策略,实现对CXL内存中低频数据的淘汰,确保CXL内存水位维持在可控范围,进一步提升系统的稳定性。

元脑KOS团队通过实现上述高级功能,使Mooncake在CXL内存上的潜能被进一步激发,从而推动Mooncake CXL存储从基础功能使能到高级特性跃迁的关键演进。

元脑KOS贡献进阶成果 高级特性落地推动CXL存储效能与稳定性的双重跃升

本次代码合入重点落地了CXL零拷贝高性能接口和CXL内存驱逐(EVICT)机制高级特性,具体贡献如下:

■实现CXL零拷贝接口,推动KV Cache读写性能的进一步提升

本次开发实现了CXL零拷贝接口(get_into/put_from)及批量零拷贝接口(batch_put_from/batch_get_into),通过了测试验证,确保了其在CXL存储场景下的正确性与兼容性。零拷贝功能的核心优势在于:通过消除数据传输的中间缓冲区,避免冗余的数据搬运,让数据可以直接在源内存与CXL内存之间高效流转,有效降低传输延迟;上层应用仅需基于Mooncake标准API进行调用,业务代码零侵入,即可提升CXL存储场景下KVCache数据的读写效率。

2.png

基于零拷贝接口的CXL存储架构

■ 实现CXL内存驱逐(EVICT)机制,为系统稳定运行提供坚实支撑

为保障CXL存储场景下持续写入数据时系统长期稳定运行,元脑KOS团队实现CXL内存驱逐(EVICT)机制,当数据达到阈值时,系统将根据元数据中维护的租约(Lease)信息,按照不同的访问热度划分KV Cache数据,通过LRU机制,选择低频访问的KV Cache数据进行驱逐,确保CXL内存水位维持在可控范围内,保障整体系统性能稳定。

通过本次贡献,元脑KOS团队重点实现了零拷贝传输与内存驱逐(EVICT)机制两项高级特性,使Mooncake在CXL内存介质上具备高效数据流转与动态资源调度的能力,不仅带来了KV Cache读写性能的进一步跃升,而且也保证了CXL存储特性在生产环境中的可靠稳定。

进一步深度融合为Mooncake生态注入新动能

本次代码合入实现了Mooncake CXL存储的高级特性,从技术、应用、生态三个维度释放价值:

        ■技术层面:实现了Mooncake CXL存储零拷贝功能和内存驱逐(EVICT)机制,带来了读写效能与系统稳定性的双重跃升。

        ■应用层面:在保证深度释放CXL存储能力的同时,实现接口解耦,上层应用无感知的情况下即可使用CXL的高效存储能力,进一步降低应用的适配难度。

        ■生态层面:为Mooncake社区提供了可直接复用的成熟CXL存储方案,加速CXL技术在Mooncake生态的落地与普及。

        推进分级存储技术能力进一步深化CXL存储效能

        此次CXL存储高级功能的代码合入,是元脑KOS团队推进Mooncake原生支持CXL技术的第二阶段核心成果,标志着Mooncake与CXL存储的深度融合,为团队后续的技术演进路径奠定了基础。按照规划,团队接下来将聚焦DRAM-CXL-SSD分级存储功能,重点完成分配策略优化、Client多协议支持以及冷热数据升降级等核心工作,持续推动以内存为中心的跨节点共享存储技术创新,进一步深化CXL存储效能。

        浪潮信息与Mooncake社区围绕CXL+AI的持续深耕,为生态伙伴带来实质价值:对Mooncake社区而言,本次贡献使Mooncake成为首个具备CXL存储高级特性生产级KVCache存储引擎,为社区开发者提供开箱即用CXL存储能力,降低基于CXL内存介质构建KVCache存储系统的适配门槛,为CXL内存在大模型推理场景中的规模化落地提供了功能完备、稳定可用的基础设施支撑。对AI Infra生态而言,本次贡献在首个PR的基础上,进一步实现了零拷贝接口与内存驱逐(EVICT)机制,使CXL存储方案进一步提升了数据读写性能与系统稳定性,助力CXL在AI Infra领域的应用落地,为行业提供了更加成熟、可靠的多元化技术选择。

        未来,浪潮信息将持续投入AI基础软件开源,将KOS内核优化能力反哺社区。在此,诚挚邀请更多开发者关注Mooncake项目,参与CXL生态建设,共同推动AI基础设施的技术革新。

        本文技术细节基于浪潮信息向Mooncake社区提交的开源代码,相关PR已合入主分支。

        「开源地址 」

        🙋欢迎访问Mooncake GitHub仓库:https://github.com/kvcache-ai/Mooncake了解详情!

        关注我们

        Copyright © 2024 浪潮信息 鲁ICP备13028953号-12

        售前咨询

        售后服务

        回到顶部

        回到顶部

        售前咨询
        售后服务