从“东数西算”甘肃节点看中国电信的算力调度探索与实践

慧聪通信网 2022-11-23 10:17 来源:通信世界全媒体

作者:中国电信股份有限公司研究院 解云鹏 马思聪 中电万维信息技术有限责任公司 田毅 张秀娟 何秀文

【慧聪通信网】“东数西算”是国家第四大跨区域的资源调配超级工程,着眼于当下数字经济发展的数据以及算力,通过打通全国高速互联网络,整合优化全国算力资源,推动东西部地区算力需求与土地、能源等资源的互补与匹配,对于我国数字经济的可持续发展具有至关重要的意义。

东数西算业务场景

“东数西算”业务场景需求如图1所示,“东数西算”需要高质量的网络连接,需要更合理的资源布局,数据中心与基础网络之间需要协同供给,用户需要计算、存储、网络的一体化服务。

从“东数西算”甘肃节点看中国电信的算力调度探索与实践

图1 “东数西算”业务场景需求分析

“东数西算”场景的核心诉求与中国电信云网融合的发展思路高度契合,中国电信践行国家战略目标,积极落实国家“东数西算”工程,全方位部署数据中心、DCI网络、算力和天翼云,前瞻性布局算力网络,实现“2+4+31+X+O”层次化部署,并在甘肃等地开展算力调度平台建设,同时推进天翼云西北节点、庆阳大数据中心、西安-庆阳-中卫/银川光缆工程、庆阳-西安-郑州光缆工程等建设工作,在差异化定位的基础上,通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动。

算力调度平台架构

甘肃省算力调度平台是中国电信打造的“东数西算”一体化算力调度平台,目标是打造高速泛在、天地一体、云网融合、智能敏捷、绿色低碳、安全可控的智能化综合性数字信息基础设施,面向全国用户实现云网业务的统一受理、统一交付、统一呈现,通过“云调网”与“网调云”两种技术路线,实现云业务和网业务的深度融合供给,满足用户一体化服务需求。算力调度平台架构如图2所示。

从“东数西算”甘肃节点看中国电信的算力调度探索与实践

图2 算力调度平台架构

算力调度平台架构分为算力运营要素、算力调度网络、天翼云技术底座、业务中台、安全中台和场景应用等部分,具体如下。

算力运营核心要素包括云、网、物资及其他资源,其中云资源包含公有云、私有云、行业云、电信专属云、信创云、天翼公有云等各类异构云资源;网资源包含运营商骨干网及算力专网;物资资源主要包含机房资源、机架资源等;在未来规划中还将包含个人终端以及边缘设备算力资源。

算力调度网络是实现云网融合、算网一体调度的基础,通过算力网关、算力路由、算网融合及算网控制等网络关键技术,为上层云网一体化调度提供服务能力。其中,算力网关作为算力资源在网络中的接入点,通过BGP协议扩展技术将算力网络中的各算力网关连通,进而获取所有纳管范围内的云资源池及算力路由信息。云网采控组件获取算力网关收集的数据,将作为算网编排及调度的数据基础。

天翼云4.0带来了算力、存储、网络的全面提升,依托5G+行业云和AI,重点覆盖社会管理、公共服务、生态环境、经济调节等产业上云场景,助力千行百业数字化转型。甘肃省算力调度平台拥抱天翼云4.0成熟的技术底座,为平台的高效研发和稳定运行奠定基础。

业务中台作为甘肃省算力调度平台的内核,主要包含算网管理、算网计量、算网大脑等组件。算网管理通过异构多云纳管技术及网络管理技术实现对异构云和网络的统一管理,为算力交易提供交易对象;算网计量的度量计算使得算力交易成为可能;算网大脑在算力一体化编排、算网采控等关键技术的基础上,实现算力资源最优策略的编排和高效调度。

安全中台采用先进安全理论,对系统进行全方位监测预警,认清风险、找出漏洞、通报结果。该平台集人防、物防、技防和联防于一体,赋能规划、设计、研发、交付、运维全生命周期,实现全方位安全态势感知,筑牢全天候网信安全屏障。在主机、应用、网络、数据、终端5个方面,采用平台对接的技术工具对关键指标进行扫描、监测和采集,识别存在风险。在人员、制度体系和专项工作3个方面,通过人工审核评分的方式,对现有人员培养、制度体系和工作落实完成情况进行评价。综合技术指标和人工评价,最终形成安全得分,该安全得分能全面准确地评估组织在网络信息安全各个层面存在的风险,能为未来的安全工作规划提供数据支撑。

甘肃省算力调度平台参照电信新一代云网运营业务系统设计原则,基于“能力与应用分离、应用与数据分离”的云化解耦思路,遵循“中心化、服务化”的架构原则,将贯穿业务运营、服务、管理全流程的云网核心能力沉淀为中台能力,面向政府、企业/个人灵活构建上层算力应用,提供丰富的业务应用场景。

平台核心服务能力

甘肃省算力调度平台提供集云、网、数、智、安等多要素于一体的融合性服务能力,实现包括算力注册、算力纳管、算力交易、算力编排、算力调度及算力监管等环节在内的全流程闭环服务体系,为用户提供一键入云、跨域部署等服务体验。

算力注册

算力资源供应商通过算力服务门户实现算力资源和算力服务的注册,目前甘肃省内各类云、数据机房以注册方式接入算力调度平台,完成零散算力的集约。

算力注册流程包含注册企业信息、注册算力信息、注册算力服务信息、注册价格信息、算力网络接通和算力资源纳管。通过注册完成对于供应商的用户画像,以及算力资源、算力服务的标签化管理,形成算力指标体系,通过算网一体化编排技术更智能、更精准地为算力消费者匹配最优资源。

算力纳管

算力纳管聚焦研发多云共管、云网协同等一体化云网系统,通过对计算、存储、网络、容器等资源的多层面协同编排,实现多云资源统一部署、运维及运营管理,形成包括公有云、私有云、容器云、信创云在内的一体化云服务能力。通过异构云纳管技术已实现对ZStack、OpenStack、Fusion、VMware等十余种类型的云资源以及容器类资源的纳管。

算力纳管功能包括计算、存储、网络资源的统一管理、面向资源的运维管理、以软件和基础设施资源的统一和自动交付为目标的资源编排管理、面向资源服务化过程的运营管理、基础设施云的租户和用户管理等,为资源的使用者提供服务门户,也为资源的管理者提供体验一致的管理能力。

算力交易

算力交易是指将算力提供方的各类算力资源,按需提供给算力消费方,包括但不限于算力提供方的资源接入、对算力消费方的资源需求和各类业务/应用场景需求的解析等,为算力使用方匹配最佳资源。算力交易流程如图3所示。

从“东数西算”甘肃节点看中国电信的算力调度探索与实践

图3  算力交易流程

通过算力运营平台完成算力服务产品的上架,基于云网采控组件采集的资源及节点信息,将商品发布到云网管理平台,消费者通过算力服务门户完成购买。

算力服务门户是集中展示算力资源及算力服务产品的一体化服务平台,消费者可以根据自己的算力需求完成订购。在算力服务门户的后台,基于消费者的算力需求及偏好智能匹配算力节点。

算力编排

作为算力调度平台的核心能力组件,算力服务编排支持云网编排及服务的策略管理。算力服务编排流程如图4所示。

从“东数西算”甘肃节点看中国电信的算力调度探索与实践

图4  算力服务编排流程

“东数西存”场景算力服务编排的流程如下:东部算力产品服务商在甘肃省算力调度平台注册算力产品,将业务服务根据算力需求(时延、带宽、算力类型、算力大小等)进行拆分,比如可以将高时延、大算力的服务部署在西部算力资源池,将低时延、小算力的服务部署在更靠近最终用户的东部资源池,满足算力业务多样化需求。

算力调度

算力调度也是算力调度平台的核心能力组件,依据算力消费者的算力需求,通过云网编排技术匹配最合适的算力资源池和网络链路,依托网络控制组件完成云网资源调度。具体算力调度流程如图5所示。

从“东数西算”甘肃节点看中国电信的算力调度探索与实践

图5  算力调度流程

算力监管

甘肃省算力调度监管平台包含算力网络、算力规模、算力环境、算力应用、算力交易、算力服务等六大指标体系,通过可视化大屏的形式,为监管部门提供决策支撑、远程控制、规划指导和指标评估。算力监管架构如图6所示。

从“东数西算”甘肃节点看中国电信的算力调度探索与实践

图6  算力监管架构

算力网络实践

中国电信在西部甘肃节点积极推进算力网络的试点工作,目前已完成“东数西渲”和域内跨资源池存储等场景的落地与验证。

“东数西渲”场景聚焦三维重建业务,东部(江苏南京)用户利用相机采集大量环境视频或图像数据,通过跨域网络上传到西部(甘肃兰州)节点,利用西部GPU算力进行大量计算和模型渲染,通过三维重建生成大型点云地图,东部节点仅需通过地图标注服务访问西部渲染完成的结果模型即可,形成“东数西渲”的东西合作模式。域内跨资源池存储作为自营的存储服务,通过算网融合调度实现跨资源池存储,该服务适用于医疗影像数据备份、短视频存储、AI模拟训练数据等冷数据备份场景。现网试点技术方案如图7所示。

从“东数西算”甘肃节点看中国电信的算力调度探索与实践

图7  “东数西渲”现网试点技术方案

该方案网络层面主要包括西部的甘肃省算力调度专网、CN2-DCI骨干网络以及东部的江苏南京城域MCN网络,管控层面包括甘肃省算网调度平台、骨干网CN2-DCI控制器以及南京城域网控制器,各资源域网络控制器对接算网调度平台中的算网编排系统,同时借助部署在各资源池节点的电信自研算力网关,获取纳管范围内的算力资源池及算力路由信息,实现对云网资源的全局统一管控和调度。

“东数西渲”目前实践的场景可覆盖600多个商业综合体、30多个景区/博物馆。域内跨资源池存储场景目前已经纳管甘肃省内存储资源近3000 PB,提供用户直接订购存储服务并使用的能力,同时也提供统一对外接口,方便用户嵌入第三方平台业务使用。

两个场景的落地实践具有代表性的意义:一方面是中国电信在“东数西算”领域开展的创新尝试,在省内建设的算力专网及算力资源调度实践,充分验证了算力网络落地的技术可行性;另一方面通过算力调度平台实现甘肃全省算力资源的统筹调度,打造全栈算力服务,全面提升IT资源利用率,助力产业数字化及数字产业化的发展。

算力作为数字经济的核心生产力,已成为全球战略竞争的新焦点。中国电信作为网络强国和数字中国建设的主力军,将坚决履行在社会经济数字化升级和“新基建”工作中的责任和担当,全面实施“云改数转”战略,强化算力网络技术创新,持续深入开展算力网络的应用实践,加快算力基础设施的建设与升级,打造有中国特色的“东数西算”示范工程。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。