首页 > 关于我们 > 新闻中心 > 媒体观察| 高质量是算力进化的下一站

媒体观察| 高质量是算力进化的下一站

2024-01-03

回首2023年,算力的热度从年初持续至年尾,此刻依然是业界瞩目的焦点。从AIGC浪潮带来的高曝光度,到IT新基建进入高景气周期,围绕算力的主题高潮迭起,其下一个“高”峰又会在哪里?

在寻找新的目标之前,先要审视一下脚下的土地。如果说数字经济是无远弗届的旷野,那么算力就是厚雪长坡的超级赛道,在演进过程中必须跨越一道道障碍。

当下,算力的主要矛盾是供需之间的严重失衡:一方面,以大模型训练为代表的先进算力供不应求,对GPU等核心器件的非理性炒作甚嚣尘上;另一方面,很多数据中心的上架率和实际利用率偏低,与应用脱节的算力基础设施难以发挥效用。

显而易见,从用户需求的角度出发,以系统性思维探索算力突围的崭新路径,构建适宜算力健康发展的生态体系乃当务之急。2023年10月,工业和信息化部等六部门联合印发《算力基础设施高质量发展行动计划》,提出完善算力综合供给体系、深化算力赋能行业应用等重点任务,为算力进化指明了方向。

依循顶层设计发出的强烈信号,产学研用各个环节正协同发力。近日,由清华大学全球产业研究院主办的“算力高质量发展与应用高端论坛”在京举行,各界精英围绕推进算力高质量发展议题展开深入研讨。浪潮信息开创性地提出“高质量算力”,定义了高算效、高能效、可持续、可获得、可评估五大特征,为高质量算力的落地探寻出可行路径。

1.jpg

浪潮信息元脑首席技术官张东

值得关注的是,作为全球领先的IT基础设施提供商,浪潮信息早在2018年即提出“计算力就是生产力”,并于2020年倡导“智算中心”建设,总是在算力演进的关键节点扮演开路先锋的角色。在算力跃迁的最新时间窗,浪潮信息元脑首席技术官张东将高质量算力形容为“五边形战士”,这意味着披荆斩棘的闯关之旅已正式开启。

2.png

第一道关卡:算力供求面临结构性失衡难题

闯关密码:高算效

创新路径:以系统设计为中心全面提升算效

如前所述,当下算力的主要矛盾是供需之间的严重失衡,一边是火焰,另一边却是海水。清华大学全球产业研究院副院长李东红认为,避免低水平、同质化的算力基础设施建设至关重要,探索差异化的算力高效利用路径迫在眉睫。

在这样的背景下,注重实测性能与资源利用率双重提升的“高算效”,也许是破局的金钥匙。实测性能不是理论峰值,而是具体应用场景下的实际性能;资源利用率则指较长时间周期内监测到的平均资源利用率,仅靠简单的算力堆砌不可能达成预期效果。

不难看出,实现高算效是一项系统工程,要从全局出发,以系统设计为核心,围绕算力的生产、聚合、调度、释放形成完整的体系。在生产环节,整合高性能部件,打造多元异构的强大算力机组;在聚合环节,消除网络与存储性能瓶颈,进行集群性能调优;在调度环节,通过上层的软件高效调度,确保平台稳定运行;在释放环节,提供丰富的框架、工具及算法优化,加速应用落地。

以目前火爆的大模型训练场景为例:单纯依赖硬件堆叠解决不了客户的难题,必须兼顾单位时间内处理的Token数量、运行时延、模型训练时间、数据处理质量等多项指标,才能满足实际需求。据张东透露,浪潮信息在“源2.0”的训练过程中,借助系统设计方法构建了面向大模型训练定制优化的AI集群系统,并采用高效的算力集群调度软件和优化模型算法,实现千卡集群平均计算峰值效率高达54%。

第二道关卡:单一的PUE无法衡量节能减碳效果

闯关密码:高能效

创新路径:构建算力全生命周期碳足迹管理模式

算力基础设施既是驱动千行百业数字化转型的基座,也是能源消耗的大户。根据中国信通院发布的报告:截至2022年底,国内在用数据中心拥有超过650万标准机架,能耗总量达1300亿千瓦时,占全国总用电量的2.7%,二氧化碳排放量居高不下。

在双碳目标的牵引下,“高能效”是在最低碳排放前提下实现最大化算力输出、确保能源利用效率的最优解。过往单一的PUE指标难以反映全貌,要准确掌握数据中心全生命周期的碳排放,需用每单位碳排放产生的算力来衡量。

从具体的落地路径来看,达成高能效要对绿色采购、绿色设计、清洁生产、绿色包装和运输、绿色运营、回收处理的算力全生命周期进行碳足迹管理。浪潮信息在服务器全生命周期管理中践行了高能效理念。例如:在绿色设计环节,基于浪潮信息液冷技术的数据中心相比传统风冷数据中心大幅节能减排,减少1.54万吨标准煤消耗、4.1万吨二氧化碳排放,相当于种植231万棵树。

第三道关卡:供应链存在隐患,技术与产业生态尚不健全

闯关密码:可持续

创新路径:依托OCTC完善产业链生态,建设开放标准体系

在日益复杂的内外部环境因素影响下,“可持续”堪称高质量算力的生命线,而供应链完备、技术兼容、服务可替代是实现“可持续”的三大要素。供应链完备是指核心部件、专用芯片、基础软件、应用软件等都能有效支撑算力的成长,技术兼容则能实现算力技术向“前”兼容、向“后”持续迭代升级,服务可替代意味着算力服务分层解耦、每层均可替代。

浪潮信息正在联合国家相关机构加快先进技术标准的制定,完善产业链生态,并以一云多芯为突破口,推动技术的分层解耦和标准开放,消除单一技术路线依赖,促进算力可持续。

第四道关卡:算力难以覆盖多元应用场景,且使用成本依然较高

闯关密码:可获得

创新路径:以算力基建化促成算力普适普惠

相关统计显示,目前国内传统行业中数字化、智能化渗透率超过10%的只有电子行业,而汽车、石化、制药等行业的渗透率在5%~10%,建材等传统行业则低于5%。

造成这种局面的因素纷繁复杂,而算力成本高、覆盖能力不足肯定是重要原因。提升高质量算力的“可获得”性,主要有两个抓手:一是普适应用场景,更好地赋能千行百业;二是普惠使用成本,让算力真正走进千家万户。

张东认为,算力基建化是实现算力普适普惠的最佳路径,而智算中心将成为最优载体。截至2023年6月,国内已投运智算中心达25个,在建的智算中心超过20个。浪潮信息联手合作伙伴推动南京、淮海、青田等智算中心建设与运营,为高质量算力的普适普惠树立了新标杆。

第五道关卡:算力评估场景简单、维度单一

闯关密码:可评估

创新路径:构建多元算力算效评估规范体系

不容回避的是,现有的算力评估体系存在明显的局限性:一是评估场景过于简单,同质化问题突出,无法全面、深入地反映算力应用的实际效能与发展潜力;二是评估维度比较单一,限制了评估体系在指导高效能、多元化算力资源配置中的作用。

针对上述痛点,高质量算力“可评估”的重要性尤为凸显——其能有效评估和比较不同系统的计算能力,辅助用户决策、推动技术创新、明确规划方向。据了解,浪潮信息正积极推动完整、准确的算力评估体系建设,面向AI、云、大数据、虚拟化等场景建立全面评价高质量算力的指标,算力“可评估”不再遥远。

高质量算力是新质生产力

在《咬文嚼字》编辑部最新发布的2023年十大流行语中,“新质生产力”高居榜首。根据权威解读,“新质生产力”是科技创新发挥主导作用的生产力,是摆脱了传统增长路径、符合高质量发展要求的生产力,是数字时代更具融合性、更体现新内涵的生产力。

3.jpg

从这个意义上讲,高质量算力无疑是新质生产力,对数字经济乃至整个国民经济发展起到举足轻重的作用。浪潮信息联合IDC、清华大学全球产业研究院发布的《2022-2023全球计算力指数评估报告》显示,十五个重点国家的计算力指数平均每提高1点,国家的数字经济和GDP将分别增长3.6‰和1.7‰,预计该趋势在2023~2026年将继续保持。

站在更长远的视角,以高质量算力带动的全方位变革,有望打破依靠摩尔定律多年形成的技术与产业生态,构建起更具系统性思维与开放性架构的崭新发展模式。浪潮信息正在这条路上加速奔跑,来自产学研用的更多力量将汇聚其间,数字新世界的未来图景值得期待。

4.jpg

注:本文转载自科技自媒体“IT创事记”