本站点使用Cookies,继续浏览表示您同意我们使用Cookies。
Cookies和隐私政策>
面对企业大模型落地过程中普遍面临的算力部署慢、推理成本高、应用编排复杂等痛点,浪潮信息与清程极智联合发布“元脑·八卦炉”一体机。该产品基于元脑NF5468系列AI服务器与清程极智Bagualu(八卦炉)智能软件栈,通过软硬件全栈深度协同,为企业智能体(Agent)、AI工作流及领域模型的训练与推理提供开箱即用、性能领先的全生命周期解决方案。
实测数据显示,“元脑·八卦炉”一体机在运行主流大模型Qwen3-32B(TP=4)场景下,卡间通信延迟从14.37微秒压缩至0.62微秒,综合推理吞吐最高提升14.45倍,实现推理性能约10倍的跨越式提升。
清程极智是专业的人工智能系统服务商,由中国工程院院士、清华大学计算机系教授郑纬民担任首席科学顾问。公司始终以“提供多快好省的AI系统解决方案”为核心目标,聚焦系统软件创新完善本土芯片软件生态,消除底层算力差异,提升算力使用效率、降低大模型落地成本。浪潮信息是全球领先的AI基础设施提供商,AI服务器全球领先,通过元脑生态推动行业开放生态建设,加速人工智能技术的落地与应用。此次合作,双方通过“元脑·八卦炉”一体机,将帮助企业用户以更低的门槛和成本,加速智能体在真实业务场景中的应用。
传统AI部署模式往往停留在“硬件堆叠+通用软件”的松耦合状态,难以充分发挥算力价值。而“元脑·八卦炉”一体机打破了这一局限,通过从芯片、服务器到软件栈的全栈垂直优化,打造了“元脑AI服务器(智能底座)+ Bagualu智能软件栈(训推部署管理平台)+ Bagualu Agent(智能核心)” 的三位一体融合。该一体机具备智能体业务直连、模型与工作流即取即用、企业级治理与可观测性三大核心能力,让非AI原生企业也能快速构建并落地智能体(Agent)与AI工作流。
实测数据显示,在运行主流大模型Qwen3-32B(TP=4)场景下:
卡间通信延迟从14.37微秒压缩至0.62微秒,带宽提升至1.4倍,显著缓解多卡协同中的通信瓶颈;
搭载清程极智自研“赤兔”(Chitu)推理引擎后,综合推理吞吐(Total TPS)相较优化前提升最高达14.45倍;
经由Bagualu智能软件栈端到端(E2E)优化,Chitu基线服务的整体推理性能实现约10倍的跨越式提升。
具体测试数据如下:

通过浪潮信息与清程极智双方联合的软硬深度调优,“元脑·八卦炉”一体机的高效推理性能,直接转化为了企业AI应用在并发响应和算力成本上的双重竞争优势。
Bagualu智能软件栈作为一套面向生产环境的全栈 AI 基础设施部署与运维平台,涵盖了从底层资源调度、应用编排、性能评测到上层 AI 应用交付的完整生命周期。清程极智在“元脑·八卦炉”一体机上对其自研推理引擎、编译优化、混合精度量化、分布式训练加速等核心模块完成了专项调优。
元脑AI服务器为Bagualu智能软件栈提供了稳定环境支撑。通过系列专属调优,该联合方案针对推理引擎的算子特性、并行计算策略,优化 GPU 算力调度的硬件中断机制,消除了传统架构中的通信与调度损耗。同时提前完成硬件拓扑与 NCCL 通信库的预配置优化,企业开箱即用就可获得最优通信性能,无需额外进行复杂的硬件调优,将算力潜能释放至极致,让软件算法得以在接近物理极限的性能水位上高效运行。

未来,浪潮信息将持续携手清程极智,依托“元脑生态”的渠道与行业资源,聚焦制造、设计、金融、能源等关键领域,联合ISV伙伴打造具备行业Know-how的垂直场景解决方案,推动AI真正融入企业核心业务流。
访问 AIStoreAIStore是基于元脑生态打造的商业协作线上平台,作为知识资源平台、交流服务平台和商机孵化平台,赋能“百模”与“千行”的对接,目前已上架200+产品和方案,在智能票据识别、AI工业质检、代码生成、视觉智能标注、AI健康助手等领域实现成功牵手和落地应用,助力千行百业加速AI产业创新,高效释放生产力。

扫码访问AIStore