比思論壇

標題: “东数西算”要建的算力互联网,如何实现? [打印本頁]

作者: lixiang007700    時間: 2022-6-5 22:33
標題: “东数西算”要建的算力互联网,如何实现?

为什么要“东数西算”?

原因有很多:算力资源分布不均、计算服务供需不平衡、算力类型多元多样难匹配……一言以蔽之,人们希望算力能够像水电一样顺着网络流动,随用随取、方便快捷。

由此,作为生产力和生产工具,算力及其载体的链接、融合、分发,在“东数西算”国家工程中至关重要。这些算力载体的互联、融合,就形成了算力网络,也即人们所说的算力互联网。

然而,算力网络看似是算力平台的资源调度、整合再分配,但这个过程并不简单。一个城市的共享单车都难以做到合理地实时调度,更何况是复杂得多的算力?

算力网络的构建,难在哪儿?

我们把“东数西算”这个时代命题换一个问法,那就是,如何真正地实现算力互联网?

从不同的观察视角,构建算力网络需要“通关”各类痛点。

中国信通院技术与标准研究所互联网中心副主任穆琙博专于政策研究与策略处置。在他看来,算力网络的建设要做到纲举目张,首先需要解决的问题是:自顶向下的技术标准规范、跨行业跨领域跨方向的产业合作、商业生态及政企互动模式的探索。

“技术向”的中科曙光高密度计算和深度学习研发总监吕灼恒长期植根于对用户算力服务的实现。他从技术角度提出,算力网络建设需要着眼于3个层面的问题:不同特点的算力中心如何有机高效地融合?数据计算的时效性和一致性如何保证?上层应用是否能够很好地整合数据和算力?

曙光智算产品运营及综合事业部总经理杨莉距离用户最近,她对于算力网络建设的挑战有三个关键词:感知、协同、智能。杨莉认为,如果说数据中心物理上的互联是“牵手成功”的话,那么算力平台层面要解决的其实是深刻的现实应用问题,比如对用户算力需求的感知、数据中心间的分立与统一、像中枢神经系统一般智能地提供服务等。

在政研、技术、用户三个角度,算力互联网在构建中潜在存在许多的难点痛点。不难发现,算力互联网的建设决不是一蹴而就的,需要在不断地示范引导下长期发展。

“头雁”的示范:智算AC平台

如果说“东数西算”工程是国家集结力量“向算力要生产力”的全面进攻,那么在大部队的冲锋号之时,早有先锋部队陷阵冲锋。在算网融合的大势所趋下,产业界的“头雁”势必率先“触网”或“组网”,这是市场需求和供给的客观规律所决定的。

中科曙光就是这样一个先行者。作为中国计算行业“老兵”,曙光二十多年来已经在全国范围内参与建设运营了数十个不同类型的计算服务中心及平台,已形成一个由点及线、连线成片、云边端算力一体的计算系统网络。在对用户多元应用提供按需服务的过程中,曙光积累了一定的算力调度、协同、系统统筹的经验,率先实践了算力互联网的服务形态。

在“东数西算”的框架下,对应到算力互联网构建的痛点,曙光将其实践中的经验加以总结,形成了一套行之有效的“智算AC平台”。

什么是智算AC平台?针对算力互联网建设痛点,曙光AC平台是如何应对的?

吕灼恒介绍说,业内普遍关注计算资源的融合整合、匹配调度、环境协同等焦点问题,智算AC平台通过算力资源汇集、组合、匹配、调度并与业务数据协同,解决上述痛点问题。简单来讲,它既是一个用户接入算力资源池的通路(Access),又是平台提供用户“千面千算”、快速实现科研创新及业务升级的加速器(Acceleration)。同时,曙光智算还会通过发掘数据、应用、算力等多维度的融合特点,根据算力投资组合协同各类资源,智能调度给用户作业(Automatic Collaboration)。

据了解,智算AC平台平台具备多中心接入能力,不但能接入曙光自有中心,同样能够接入合作中心和用户私有中心,在计算服务中台集成科学计算、工程计算和智能计算能力,并开通多种渠道提供用户的接入及访问。

吕灼恒说,正是在在呼应各类用户需求的不断实战中,智算AC平台形成了它一体化计算资源通路、千面千算加速用户应用、万数协同智能调度的特点。他认为,作为一个算力一体化的云服务平台,曙光智算AC平台的资源协同调度功能,是算力网络得以实现的灵魂和中枢。

目前,曙光智算AC平台已进阶到3.0版本,已为数万用户提供了计算服务赋能。

算力要率先进化到“元宇宙形态”

在曙光智算 AC 平台,有这样一个案例。

杨莉介绍说,曙光通过与中科院大气物理所合作,完成了一个名为“全球区域一体化天气预报模式系统”的开发,目前该系统已经在曙光智算AC平台运行了两年多的时间。借助后台通力协作的算力系统,该系统能够以非常高的分辨率预报未来 10 天全球区域的天气系统。

当算力或智算平台能够做到随用随享,类似天气系统的计算都可以随用户需要而定制。一定意义上讲,算力定制、算力资源服务化也是算力网络从协同到融合、计算需求越来越细分的预期结果。这种形态,特别类似近期热门的元宇宙概念:算力要顺流而下,就要率先进化到“元宇宙形态”。

但吕灼恒观察到,目前用户在获取算力资源和服务的的过程中还算不上高效便捷,在“东数西算”战略之下,算力互联网的优化和提升意义重大。

从需求的角度出发,推动供给侧改革,这条市场观念不会过时。但要关注的是,迄今为止“东数西算”国家战略中对算力网络“8 算力枢纽、10 数据中心”的布局,仍处于对“主干”数网的铺设,尚未顾及到千行百业具体需求的“枝叶”。

“如何把神经旁路和末梢——这些感官系统的重要组成完全建设起来,我相信还需要很长一段路要走。”穆琙博说。

要打通末梢系统,杨莉觉得曙光智算AC平台可以作一参照。“我们希望把 AC 平台作为一种能力输出给各类算力或网络持有方,利用中台功能屏蔽各类中心的差异、匹配应用。”杨莉说,他们也正对此开展实践。







歡迎光臨 比思論壇 (http://108.170.10.234/) Powered by Discuz! X2.5