本站点使用Cookies,继续浏览表示您同意我们使用Cookies。
Cookies和隐私政策>
近日,浪潮信息旗下元脉网络推出25.6T本土芯片AI交换机C400。该产品专为AI网络设计,搭载25.6Tbps本土交换芯片,提供64个400G QSFP112端口,基于可靠、开放、智能三大理念,通过超大规模算力系统互联、多重可靠保障、智能运维等创新技术,支持十万卡级组网,为大规模智算系统构建高效、稳定的AI网络底座。
当前,随着AI算力规模持续扩张,万亿级模型训练对网络传输稳定性、异构兼容性与运维效率提出更高要求。超大规模训练中,高并发、强突发的通信流量与频发的网络故障严重影响模型训练效率,同时生态碎片化与系统封闭化也推高了算力系统的构建与演进门槛。
为此,元脉网络全新推出的C400专门面向AI时代的网络需求设计,在架构、硬件、软件多个层面进行可靠性强化,支持十万卡级智算系统的高效互联,并通过EMLB动态负载均衡技术,针对不同AI计算场景实现流量智能调度与拥塞主动规避,大幅提升网络稳定性和GPU资源利用效率。同时,其开放架构全面兼容多元AI网络软件生态,结合智能化运维能力,显著降低AI网络部署与运维复杂度,为大规模算力系统的高效运行提供领先的AI网络支撑。
在大规模算力互联组网系统中,通信规模与复杂性剧增,规模越大故障点越多,而硬件故障或链路故障都可能会产生丢包,导致通信效率下降甚至失败,从而引起整个集群计算中断、训练任务回滚数天,造成巨大的算力浪费与经济损失。
为从底层构建全面可靠的AI网络安全屏障,C400采用业界领先的25.6T本土交换芯片,及本土化的核心元器件,满足客户对信息安全和供应稳定的要求。整机架构方面,C400基于固定端口的单主板架构,规避了主板和线卡之间的高速连接器、电源连接器等高发故障点,并有效减少整机PCB板卡数量,显著降低系统整体故障率。
同时,C400硬件层集成IGE智能防护功能,对关键部件进行冗余备份,实现关键硬件的全面监控与故障隔离,并支持异常掉电保护、内存纠错等多重故障预防机制,从硬件层面筑牢AI网络可靠性防线;软件层面,C400采用领先的SONiC容器化架构,实现功能模块间的隔离运行,并支持关键模块热重启和热升级,确保软件运行不中断,精准适配AI网络环境的高稳定性需求。
开放网络SONiC技术正以全球化的协作创新模式,推动智算中心技术发展,带动了网络硬件、系统软件、业务应用的快速迭代。C400基于开放架构设计,实现软硬件全面解耦,全面兼容开源SONiC、SONiC商业衍生版元脉UXOS,也可支持第三方操作系统,深度契合不同客户软件栈多样化需求。
在商业模式上,相较于闭源、单一的交付方式,元脉网络能够提供纯硬件交付、C400+SONiC源码支持交付,以及软硬一体的TurnKey交付三种方案,精准匹配用户在研发效率、部署效率等方面的多样化需求。
C400将智能化贯穿于部署、运维全生命周期,通过RoCE、“盒-盒组网”等技术及方案,实现一键最优部署、毫秒级故障感知定位等创新,在确保业务连续性的同时,大幅降低AI网络的运营复杂度与总体拥有成本(TCO)。
针对智算中心AI网络部署复杂、部署周期长的问题,C400创新性地实现了RoCE网络参数的一键最优部署。通过自动化与智能化的配置流程,大幅简化了手动调优步骤,将部署调优效率提升了35%,显著加速了业务上线进程。
大模型训练场景对网络的丢包、抖动、光模块/光纤等故障异常敏感,特别是丢包可能导致训练中断、进度回滚等问题。C400搭载的MoD监测功能可快速感知各类故障异常,并精准锁定问题根源,实现丢包等故障事件的毫秒级定位,大幅缩短故障恢复时间,保障业务稳定运行。
在能耗管理方面,C400采用phyless技术,省去PHY芯片等高功耗有源器件,并通过极致调优的散热策略,保证散热效率的同时有效降低风扇转速,整机功耗降低15%以上。C400创新的“盒-盒组网”模式,更可降低企业总体拥有成本(TCO)50%,大幅削减长期能耗和运维投入,帮助企业实现经济效益与可持续发展的完美平衡。
AI赋能未来,互联构筑基石。元脉网络是浪潮信息旗下网络业务品牌,作为AI时代网络创新引领者,元脉网络可以为用户提供面向AI时代的智算中心、数据中心、边缘网络等全栈网络方案。并坚持可靠、开放、智能的发展理念,持续深化自身在技术创新、场景创新、合作创新上的能力,为AI时代算力、数据价值的释放,打造坚实互联基石。
访问 AIStoreAIStore是基于元脑生态打造的商业协作线上平台,作为知识资源平台、交流服务平台和商机孵化平台,赋能“百模”与“千行”的对接,目前已上架200+产品和方案,在智能票据识别、AI工业质检、代码生成、视觉智能标注、AI健康助手等领域实现成功牵手和落地应用,助力千行百业加速AI产业创新,高效释放生产力。

扫码访问AIStore