本站点使用Cookies,继续浏览表示您同意我们使用Cookies。 Cookies和隐私政策>

简体中文
首页 > 关于我们 > 新闻中心 > 清程极智+浪潮信息:“元脑·八卦炉”一体机,智能体推理性能跃升10倍!

清程极智+浪潮信息:“元脑·八卦炉”一体机,智能体推理性能跃升10倍!

2026-03-06

面对企业大模型落地过程中普遍面临的算力部署慢、推理成本高、应用编排复杂等痛点,浪潮信息与清程极智联合发布“元脑·八卦炉”一体机。该产品基于元脑NF5468系列AI服务器与清程极智Bagualu(八卦炉)智能软件栈,通过软硬件全栈深度协同,为企业智能体(Agent)、AI工作流及领域模型的训练与推理提供开箱即用、性能领先的全生命周期解决方案。

实测数据显示,“元脑·八卦炉”一体机在运行主流大模型Qwen3-32B(TP=4)场景下,卡间通信延迟从14.37微秒压缩至0.62微秒,综合推理吞吐最高提升14.45倍,实现推理性能约10倍的跨越式提升。

清程极智是专业的人工智能系统服务商,由中国工程院院士、清华大学计算机系教授郑纬民担任首席科学顾问。公司始终以“提供多快好省的AI系统解决方案”为核心目标,聚焦系统软件创新完善本土芯片软件生态,消除底层算力差异,提升算力使用效率、降低大模型落地成本。浪潮信息是全球领先的AI基础设施提供商,AI服务器全球领先,通过元脑生态推动行业开放生态建设,加速人工智能技术的落地与应用。此次合作,双方通过“元脑·八卦炉”一体机,将帮助企业用户以更低的门槛和成本,加速智能体在真实业务场景中的应用。

传统AI部署模式往往停留在“硬件堆叠+通用软件”的松耦合状态,难以充分发挥算力价值。而“元脑·八卦炉”一体机打破了这一局限,通过从芯片、服务器到软件栈的全栈垂直优化,打造了“元脑AI服务器(智能底座)+ Bagualu智能软件栈(训推部署管理平台)+ Bagualu Agent(智能核心)” 的三位一体融合。该一体机具备智能体业务直连、模型与工作流即取即用、企业级治理与可观测性三大核心能力,让非AI原生企业也能快速构建并落地智能体(Agent)与AI工作流。

实测数据显示,在运行主流大模型Qwen3-32B(TP=4)场景下:

  • 卡间通信延迟从14.37微秒压缩至0.62微秒,带宽提升至1.4倍,显著缓解多卡协同中的通信瓶颈;

  • 搭载清程极智自研“赤兔”(Chitu)推理引擎后,综合推理吞吐(Total TPS)相较优化前提升最高达14.45倍;

  • 经由Bagualu智能软件栈端到端(E2E)优化,Chitu基线服务的整体推理性能实现约10倍的跨越式提升。

具体测试数据如下:

元脑·八卦炉一体机卡间性能对比图.jpg

通过浪潮信息与清程极智双方联合的软硬深度调优,“元脑·八卦炉”一体机的高效推理性能,直接转化为了企业AI应用在并发响应和算力成本上的双重竞争优势。

Bagualu智能软件栈作为一套面向生产环境的全栈 AI 基础设施部署与运维平台,涵盖了从底层资源调度、应用编排、性能评测到上层 AI 应用交付的完整生命周期。清程极智在“元脑·八卦炉”一体机上对其自研推理引擎、编译优化、混合精度量化、分布式训练加速等核心模块完成了专项调优。

元脑AI服务器为Bagualu智能软件栈提供了稳定环境支撑。通过系列专属调优,该联合方案针对推理引擎的算子特性、并行计算策略,优化 GPU 算力调度的硬件中断机制,消除了传统架构中的通信与调度损耗。同时提前完成硬件拓扑与 NCCL 通信库的预配置优化,企业开箱即用就可获得最优通信性能,无需额外进行复杂的硬件调优,将算力潜能释放至极致,让软件算法得以在接近物理极限的性能水位上高效运行。

元脑·八卦炉一体机三大版本:基础版、标准版、创新版.jpg

未来,浪潮信息将持续携手清程极智,依托“元脑生态”的渠道与行业资源,聚焦制造、设计、金融、能源等关键领域,联合ISV伙伴打造具备行业Know-how的垂直场景解决方案,推动AI真正融入企业核心业务流。

售前咨询

售后服务

意见反馈

AIStore

回到顶部

回到顶部

收起
回到顶部 回到顶部
请选择服务项目
售前咨询
售后服务
访问 AIStore

扫码访问AIStore