打破云网边界,算力网络将从探索走向成熟
作者:中国电信股份有限公司研究院 雷波
【慧聪通信网】作为云网融合体系中一种新出现的技术发展方向,算力网络通过扩展网络能力,自下而上开展资源融合,将多级泛在的算力进行协同,彻底打破云网边界,促使算力在各方之间流动,将算力从局部资源转为全局资源,构建融合化的ICT资源底座,为各类应用提供灵活、按需、一致的服务体验,为数字化转型奠定基础。
算力不断发展推动数字经济持续高速增长,而数字经济持续向前又进一步加深对算力的依赖,人类正在迈向万物感知、万物互联、万物智能的“算力时代”。正如中国电信总经理李正茂在“第三届世界科技与发展论坛”上所指出的,“数字经济正在从工业引领走向数字经济驱动的新阶段,目前我国算力产业每投入1元,将平均带动3~4元的GDP经济产出。预计到2025年,中国90%的应用将迁移到云上,中国企业上云率将达到85%,各行业将逐渐从上网演变成上云”。
伴随着智能业务的兴起,信息基础资源服务模式正从单点离散服务向一体化服务的方向演进,其中算力集成创新服务将成为未来信息服务领域确立竞争优势的关键要素。为了将算力资源与网络资源融合在一起并提供服务,业界从不同角度提出了多种技术路线,比如以“云调网”为方向的分布式云技术方案,以“网聚云”为方向的算力网络技术方案等,这些方案受到了“产学研用”各方的极大关注,目前正从技术、设备、标准、应用、运营等多维度快速推进。
其中,算力网络技术是一种架构在IP网之上,以算力资源调度和服务为特征的新型网络技术。算力网络是以网络为平台,连接多方、异构的算力等资源,将碎片化的闲散资源连接起来,实现统一调度,以提供计算、存储和网络等多维资源的一体化服务,可以满足智能业务的多样化需求,并能够在移动性等场景中保持服务体验的一致性。本文将重点介绍算力网络技术,探讨当前进展与未来发展方向。
云网一体化服务的挑战与方案
随着智能业务对算力资源和网络资源的服务能力要求不断提升,基于云网融合的一体化服务成为发展趋势,如中国电信在《云网融合2030技术白皮书》中将云网融合分为3个阶段,其中第三阶段即为云网一体阶段。在这个阶段中,要实现3个“一体”:首先是一体化供给,网络资源和云资源统一定义、封装和编排,形成统一、敏捷、弹性的资源供给体系;其次是一体化运营,从云和网各自独立的运营体系,转向全域资源感知、一致质量保障、一体化的规划和运维管理;再次是一体化服务,面向用户实现云网业务的统一受理、统一交付、统一呈现,实现云业务和网络业务的深度融合。
但多年的实践证明,云与网的发展路径不同,两者之间的差异非常大,甚至在有些文献中上升到思维层面,比如IT思维/CT思维等。因此,当两者的思维方式都存在差异时,云网融合过程将面临诸多挑战。现阶段,云和网还保持着相对的独立性,这对数字化转型的进程产生了一定的影响。比如,从服务层面来看,异构的算力资源与多域的网络资源缺乏统一、灵活的能力提供和调度,业务敏捷度不足,服务效率受到制约;从运营层面来看,云和网资源散布各地,分域管理、端到端的云网运维排障较为困难。
为了解决云网融合面临的挑战,研究人员从单一技术研究开始,逐渐形成了多种技术路径,这些方案大多从一侧出发,然后逐步将另一侧融合进来,进而实现两者的融合与一体化服务,目前比较典型的方案有以“云调网”为思路的分布式云技术,以及以“网聚云”为方向的算力网络技术。
分布式云技术
分布式云作为云计算的一种新发展方向,能够将不同地理位置、规模各异的节点统一纳管到一套完整的管控与服务体系中,让用户只看到“一朵云”,以提供标准统一、高效便捷、安全可靠的云服务。以中国电信天翼云4.0为例,以“2﹢4﹢31﹢X + O”资源布局为基础,兼顾性能与成本,在提供传统云服务的基础上,为用户提供低时延、数据本地化的服务,可以满足自动驾驶、超高清直播、AI推理等新兴业务场景对大带宽、低时延、数据合规的需求。
这个过程中,分布式云服务水平有赖于网络能力的开放程度,即网络能力能够在多大的范围内开放给统一的云调系统,让云调系统能够根据用户需求选择并调配恰当的算力资源与网络资源。一种方案是实现网络的IT化,但这需要深入理解网络资源的禀赋,即需要基于IT思维理解以CT思维构建的基础网络,让云调系统像调用算力资源那样调用网络资源,其难度可想而知,目前来看技术进展较为缓慢。另一种方案则是目前业界主流云服务商的Overlay方案,屏蔽基础网络的差异性,利用SD-WAN等技术实现网络连接的按需快速建立与一体化服务。
算力网络技术
从另一个视角看,多云之间存在差异性,跨服务商一体化管控困难。为了满足业务在多云之间部署的需求,同时能够吸纳社会闲散算力资源,提升资源利用效率,算力网络技术应运而生。以网络为平台,其利用无处不在的网络连接将多级、多方的算力资源进行整合,提供一体化服务和最优化资源供给。算力网络技术能够将资源的地址属性转换为以用户为中心的网络指标属性,让使用者从模糊的、大概的距离判断,转化成为精准的带宽、时延等网络指标判断,便于各类业务按需调用多方资源,从而逐步推动网络从纯粹的数据传输管道,升级为承载更多价值可能性的数字经济中枢。
与分布式云技术相对应,算力网络技术被认为是从CT思维的角度解决云网融合的难题。因此算力网络技术中被质疑最多,同时也是最难实现的部分,就是对算力资源的标准化,即不同归属方、不同类型的算力资源能否采用相同的度量模式,能够让上层业务不用感知底层资源差异,而只根据业务需求来选择部署位置和部署方式。换句话说,算力网络技术的发展需要推动算力资源的标准化,对此部分业内专家表示了担忧。
综上所述,目前提出的两种云网融合技术路线都面临着不同的挑战,要实现云网一体化服务,还需要进一步分析理解云和网的内涵,才能将两类资源有机地整合起来,提供一体化供给、一体化运营与一体化服务。另外,需要特别指出的是,上述两种技术路线并不是对立的关系,两者分别从不同的角度提升云网一体化服务水平,未来可以有机协同、相互促进,从而为用户提供多样化的选择。
算力网络技术体系与关键问题
虽然算力网络技术正式提出只有短短的3年时间,但其继承了网络技术领域多年来的研究方法及成果,与现有的网络技术一脉相承,既能够发挥现有IP技术体系的优势,又能提供整合多维资源后的一体化服务。
2021年7月,ITU-T发布了第一个算力网络技术的国际标准Y.2501,其中将算力网络体系分为4个层面,分别是算力网络资源层、算力网络控制层、算力网络服务层以及算力网络编排管理层。具体如图1所示。
图1 算力网络体系
同时,有鉴于算力网络标准工作的积极开展,ITU-T SG13建议开启Y.2500系列编号,以Y.2501 “Computing Power Network- framework and Architecture”为首个标准,形成算力网络系列标准。同时,中国通信标准化协会(CCSA)也启动了算力网络系列标准编制工作。
算力网络技术重点强调了资源供给与用户需求的多样性,比如资源节点的多样性(集中的大型云计算节点、分散的边缘计算节点以及无处不在的端计算节点等)、资源归属的多样性(云服务商的资源池、电信运营商的资源池、区域性供应商的资源池、行业用户自身的资源池等)、业务需求的多样性(成本优先、时延优先、安全优先等),因此算力网络技术必须面对多方、异构的难题,目前主要从以下几个层面开展研究工作。
一是算力度量:要求量化异构算力资源以及多样化业务需求,并建立统一的描述语言,在赋能算力流通属性的同时,为算力的感知、管控、服务提供基础和标准。
二是算力感知:通过主动或被动的方式,在对算力进行统一度量与标识的基础上,获取业务算力需求信息以及算力资源信息,从而为算力网络调度编排提供基础,实现资源配置最优化。
三是算力路由:将网络资源信息与算力资源信息进行有机整合,通过网络在指定区域内进行通告,实现全局信息的共享,并将算力最优作为IP选路的准则之一。
四是算力编排:不仅对网络资源与拓扑信息进行管控,同时还根据全网算力资源信息与用户算力需求,从全局视角进行资源的最优化选择与分配。
五是算力交易:向算力需求方提供从资源选择到资源使用的一体化服务,形成统一的资源供给机制,满足各类新兴业务的多样化需求。
目前,业界各方都在积极推进算力网络技术的研究与落地试点,比如网络5.0产业和技术创新联盟(N5A)、边缘计算产业联盟(ECC)、算网融合产业联盟、IMT-2030(6G)推进组等产业组织都成立了专门的算力网络工作组,以集中探讨算力网络技术研究与落地应用。
算力网络技术发展趋势与研究重点
算力网络技术还在持续研究演进中,其中,尽快验证算力网络商业模式的合理性是重中之重,即是否能够实现算力网络技术的初衷,将闲散的算力资源整合起来,让算力资源与网络资源一体化服务于新兴业务。
在近期,算力网络技术落地实现主要有4种方案。
一是集中式。通过集中的管控平台,统一收集全网的算力资源、网络资源以及其他资源信息,用户将业务需求发送给集中管控平台,由该平台利用全局视角进行最优化的资源选择与分配。
二是分布式。通过在路由协议(如BGP、OSPF等)增加相应的算力资源信息分发能力来实现,通过协议扩展属性传递算力资源的ID、位置、度量值,用户则通过收到的资源路由表选择适合的多维度资源。
三是混合式。集成了集中式与分布式的优点,简单而言就是在信息分发阶段采用分布式的信息分发方案,在资源选择阶段则通过集中的管控平台实现。但目前来看,实现方案相对复杂,有待进一步研究。
四是域名解析式。参照传统CDN方案,先将资源归一化到标准的资源单元,然后由算力网络管控平台根据用户需求集中分配。本方案重点在于算力资源的标识体系建立,目前已经开始相关标准的编制工作。
目前来看,集中式方案相对容易实现,已有主流厂家在研发相关系统,预计2022年能够在小范围内开展试商用部署。
在中长期研究领域,算力网络目前被认为是6G与未来网络中一项重要的基础技术。算力网络技术将以“通感算”一体化为核心,将“云-边-端”多级算力通过网络化的方式进行连接与协同,实现算力服务的按需实时调度与高效共享,为各类业务灵活匹配最佳算力资源节点。
业界认为算力网络技术将在6G与未来网络中起到以下两方面作用。
一是面向未来业务场景,如全息通信、自动驾驶、VR视频(元宇宙)等,算力网络技术根据新一代业务需求综合考虑实时的网络、算力、存储等多维资源状况,为业务灵活匹配最佳资源节点或最佳资源组合。
二是以算力网络技术为基础,构建6G与未来网络的资源底座。与5G网络相比,6G网络将向着智能内生、泛在连接、绿色共享以及柔性极简的方向发展,其网元的功能及分布也将更加灵活。算力网络技术将通过对网络带宽、路径、时延及抖动的管控,以及对算力资源的动态感知,为6G与未来网络功能的灵活部署、网络功能的快速协同提供基础,从而满足6G与未来网络复杂、动态的架构需求。
总体而言,当前算力网络技术研究得到了各方极大的关注,针对相关技术问题的研究也正在快速推进中。无论是在近期落地试点,还是在中长期技术研究中,算力网络技术将支持云网融合战略的实现,即实现IT与CT的深度融合,以此提供更高质量的服务保障和创新的服务形态,这将有望成为运营商新的业务增长领域和技术创新领域。