本站点使用Cookies,继续浏览表示您同意我们使用Cookies。
Cookies和隐私政策>
当科研迈入“AI融合”阶段,高校如何构建匹配的科研基础设施?
当前,人工智能技术已深度渗透高校科研,在生物信息、材料模拟、气候预测、临床医学等诸多前沿领域成为关键驱动力,“AI for Science”正成为推动科研范式的深刻变革。然而,传统科学计算平台与AI算力平台在架构设计、资源调度和运维体系上存在显著差异,导致二者往往独立部署、并行运行,形成“两张皮”的困局。这种割裂不仅造成算力资源孤立、利用率低下,更从底层阻碍了跨学科、跨范式的科研协同与创新突破。
作为国家“双一流”建设A类高校,东南大学与浪潮信息合作部署的智能计算平台于近日正式上线。该平台采用“硬件融合、平台调度、智能运维”一体化架构,基于元脑NF5280G7与NF5468G7构建统一异构算力资源池,通过ClusterEngine与InManage实现跨负载智能调度与全栈自动化运维,全面支撑传统科学计算与AI训练推理的混合部署。平台为学校生命科学、工程仿真等前沿研究提供了高效、弹性的一体化算力支撑,助力生命科学与技术学院果蝇发育遗传实验室等科研团队提升研发效率,实现资源利用与科研协同能力的系统性升级。

东南大学作为国家“双一流”建设A类高校,在工程学、计算机科学、材料科学等多个学科领域具有显著优势。当前,随着科研数据规模持续扩大与AI for science研究范式深度渗透,该校科研活动呈现出多模态、高并发的新特征。以该校生命科学与技术学院果蝇发育遗传实验室为例,高校的科研算力基础设施普遍存在“双轨制”现实困境:一方面是传统的CPU科学计算平台,承担分子动力学模拟、基因序列组装与比对、结构生物学计算等经典生命科学任务;另一方面则是以GPU为核心的AI算力平台,支撑大模型训练、蛋白质结构预测等前沿智能应用。两套系统长期分散建设、独立运行,形成了“计算密集型”与“智能密集型”的资源孤岛,进而引发三大核心痛点:
■ 资源利用率低下:传统CPU集群难以高效支撑AI任务,而专用GPU资源在非训练时段大量闲置,二者无法实现弹性调度与互补,导致算力资源整体利用率偏低,综合运维成本高。
■ 数据流转成本高昂:跨范式科研需在计算与智能平台间频繁迁移TB/PB级数据,流程冗长、协同困难,形成“数据血栓”,从根本上制约了算力协同与科研工作流的贯通,拖慢创新节奏。
■ 运维复杂度陡增:IT团队需同时维护两套独立的软件栈、调度系统和监控工具,不仅技术复杂性倍增,也显著增加人力成本与管理负担。
这种割裂局面,本质上源于科学计算批处理任务与AI交互式任务在调度策略、运行环境与数据I/O模式上的根本性冲突。因此,高校亟需一套能够将CPU与GPU算力深度融合、统一调度的一体化平台,实现异构资源的“同场调度”与智能分配,既满足分子模拟、基因分析等传统HPC任务的批量处理需求,也能支撑深度学习、大模型训练等AI任务的弹性资源扩展,真正打通“计算”与“智能”之间的算力壁垒。
面对资源利用率低、数据流转难、运维成本高等现实痛点,浪潮信息为东南大学量身打造了一体化智能计算平台,以“硬件统一纳管、平台智能调度、运维集中管控”为核心,从根源上破解算力“两张皮”困局,真正打通传统HPC与AI应用之间的壁垒。科研人员可在同一平台上完成从基因组测序、分子模拟等计算密集型任务,到大模型推理、文献智能解析等AI驱动的科研工作,实现跨范式科研流程的高效衔接:
统一的资源纳管,提供强大的算力底座:平台突破传统“分区建设、各自为战”的运维模式,基于元脑NF5280G7(通用计算)与NF5468G7(AI计算)服务器,通过统一的资源纳管架构,为高频科学计算提供稳定、可持续的算力支撑。NF5280G7承担基因序列组装、分子动力学模拟等高吞吐科学计算;NF5468G7则为大模型训练、蛋白质结构预测、文献智能解析等AI应用提供强劲GPU加速。二者不再是各自为战的孤立集群,而可统一调度、按需分配的算力“活水”,从根源上消除硬件隔离带来的资源闲置与浪费。
智能调度,攻克“批处理”与“低延迟”的冲突核心:平台通过ClusterEngine智能调度系统。它如同一位智慧的“交响乐指挥”,统一纳管CPU与GPU资源,实时感知任务特征并动态调整分配策略。它能够智能平衡科学计算的长时批处理任务与AI短时交互/推理任务之间的资源争抢:一方面确保AI训练和推理任务获得低延迟响应,不会被大型计算任务“饿死”;另一方面保障分子模拟、基因分析等科学计算任务的计算连续性。科研人员无需关心底层资源分布,只需通过统一入口提交任务,即可实现“模拟—分析—推理”全流程的无缝衔接,彻底打通数据流转的难点。
智能运维,实现全栈可视化与自动化:借助InManage统一管理平台,运维团队实现对融合架构下所有计算、存储、网络设备的集中监控与自动化运维。平台提供全栈可视化能力,将原本复杂的异构环境故障定位时间大幅缩短;通过策略化自动运维,持续降低人为错误风险,保障7x24小时科研任务的稳定运行,让IT团队从繁重的日常运维中解放出来,专注于更具价值的创新工作。

该平台未来将持续服务于东南大学生命科学与技术学院果蝇发育遗传实验室等多个前沿团队:高校科研团队能够“按需取用、无缝协同”地使用算力资源,生命科学实验室既能在CPU集群上高效完成基因序列比对,也能随时调用GPU资源启动蛋白质结构预测训练;工程仿真团队既可在传统计算节点运行大规模模拟,也能快速切换至AI推理节点进行结果分析。科研流程不再受制于算力架构的割裂,创新效率真正实现从“能用”到“好用”的跃升。

未来,浪潮信息将继续聚焦教科研场景的特定需求,持续优化算法库、工具链及一体化平台能力,为高校提供从算力供给到应用创新的全栈支持,助力高校科研在“计算+智能”融合的新阶段,实现更敏捷、更协同的创新突破。
访问 AIStoreAIStore是基于元脑生态打造的商业协作线上平台,作为知识资源平台、交流服务平台和商机孵化平台,赋能“百模”与“千行”的对接,目前已上架200+产品和方案,在智能票据识别、AI工业质检、代码生成、视觉智能标注、AI健康助手等领域实现成功牵手和落地应用,助力千行百业加速AI产业创新,高效释放生产力。

扫码访问AIStore