大科学装置|超级算力背后,TA们扮演了什么角色?( 二 )


专家认为 , 超算中心和人工智能计算中心两者战略定位不同、服务领域不同、所使用的技术体系也不同 , 是计算领域的两个重要发展方向 。
在战略定位方面 , 超算中心立足于科学研究 , 是支撑国家科研体系的大科学装置 , 主要解决大系统、大工程、大科学的问题 。超级计算机系统对国家提升整体科研创新实力和应对科学挑战具有重要战略意义 。
人工智能计算中心立足于赋能产业 , 是支撑数字经济的基础设施 。提前规划和布局人工智能计算中心 , 可为大规模AI算法和模型研究形成条件支撑 , 促进人工智能赋能各行业 , 实现数字经济高质量发展 。
从应用方面说 , 超算中心主要应用于重大工程或科学计算领域的通用和大规模科学计算 。如新材料、新能源、新药设计、高端装备制造、航空航天飞行器设计等领域的研究 。
人工智能计算中心主要支持人工智能与传统行业的融合创新与应用 , 提升传统行业的生产效率 。在自动驾驶 , 辅助诊断、智能制造等方面大显身手 。
在技术架构上 , 超算的核心计算能力由高性能CPU或协处理器提供 , 注重双精度通用计算能力 , 追求精确的数值计算 , 单位是“FLOPS”(每秒浮点运算能力) 。
人工智能的核心计算能力由训练、推理等专用计算芯片提供 , 注重单精度、半精度等多样化计算能力 , 是一种不确定的近似计算其单位应该是“OPS” 。
“这是两个不同的单位 , 不能直接横向比较 。”中国计算机学会高性能计算专业委员会秘书长张云泉说 。
精准适配算力
【大科学装置|超级算力背后,TA们扮演了什么角色?】随着人工智能技术的应用越来越广泛 , 人工智能与超算的结合将愈来愈紧密 。
作为一种通用算力 , 超级计算机的高精度计算能力更强 , 应用范围更广 。
专家介绍说 , 超算系统当然可用于完成人工智能计算任务 , 但成本高、效率低 , 浪费严重 。
曾有超算中心通过增加图形加速器硬件(GPU)来应对AI类需求 , 但算力消耗巨大 , 以训练一个有1750亿参数的GPT-3模型为例 , 需要“355个GPU年”(一块GPU运行355年的运算量) , 一次训练费用就高达460万美元 。
显然 , 使用超算技术架构处理人工智能业务成本高昂(经费或者时间) 。
中国工程院院士陈左宁曾用“大马拉小车” , 来形容用超级计算机做AI计算虽然“十项全能” , 但毕竟不是为AI量身打造 。
“人工智能计算中心借鉴了传统超算中心大规模并行和数据处理的技术架构 , 以图形芯片为计算算力底座 , 为人工智能快速赋能发展和应用提供新型算力基础设施 。”浙江大学计算机科学与技术学院副院长、浙江大学人工智能研究所所长吴飞对《中国科学报》说 。
区别于传统的超算中心 , 人工智能计算中心因产业而生 , 尽管在赋能产业方面游刃有余 , “但让智算中心去跑需要运行数万不同类型软件的任务 , 就勉为其难了” 。
“赋能”新赛道
当前已从“AI+”时代步入“+AI”时代 , 我们迫切需要像“发电厂”一样的基础设施 。
“AI+”时代的主要目标是探索人工智能自身能力 , 而“+AI”时代的特点是千行百业融合AI , 走向场景化应用 。

猜你喜欢