中国移动大数据中心:紧抓“东数西算”新机遇,创新驱动大数据基础设施革新
【慧聪通信网】在全国“一盘棋”的算力总体规划下,推动实施“东数西算”工程意义深远。
算力作为当今时代的核心生产力,其对于数字经济时代发展的重要性,如同水利之于农业、电力之于工业,已经成为推动经济社会数字化发展的重要驱动力,也正成为全球战略竞争的新焦点。国家在全社会算力需求激增、算力资源区域分布不均衡的背景下,推出了“东数西算”这一超级工程。“东数西算”对于整合优化我国算力资源,推动东西部地区算力需求与土地、能源等资源的互补与匹配具有重要战略意义。
东数西算超级工程的实施对国家和企业而言都具有深远意义。从宏观层面看,全国“一盘棋”的算力总体规划,对我国数字经济发展具有重要的战略引导作用。既有利于促进合理布局、绿色集约、互联互通的数据中心发展,又肩负着战略性保障国家数据安全、调整全国产业布局的使命。基于算力总体规划,实施“东数西算”工程,有利于促进国家整体经济协调发展。既有助于提升国家整体算力水平,促进国家整体经济发展,又有利于推动区域协调发展,通过算力枢纽和数据中心集群建设,有力带动产业上下游投资,形成东西部协同发展新格局。
从企业层面看,实施“东数西算”工程是促进企业绿色集约、降本增效、自主创新发展的新机遇。一方面,数据中心能耗高、占地多,而西部绿色能源、土地资源充裕,将数据中心统筹布局至西部,可大幅节约企业电力和土地成本。另一方面,当前我国信息产业在关键核心能力自主创新上仍存在较大不足,表现在基础软件过度依赖国外技术,新技术突破引领不足。实施“东数西算”工程,为企业推进关键核心技术攻关,构建科技领先优势,进而实现产业创新发展带来历史性契机。
推进实施“东数西算”工程,大数据领域需要做好顶层设计,实现基础设施革新。
在各种算力需求中,大数据是对算力需求更旺盛的领域。随着数字经济的深入发展,数据规模持续膨胀,大数据中心负责海量数据的汇聚、加工及开放,表现出算力资源消耗大、服务时效多样化、数据安全要求高等特点。推进实施“东数西算”工程,大数据领域需要解决三个主要问题。
一是如何在“东数西算”新格局下继续保障数据服务的时效性。随着大数据产业的蓬勃发展,大型数据中心日数据接入处理量已达PB级,且数据服务的时效性要求越来越高。在高时效性要求下,数据远距离传输再加工难以满足要求,因此在大数据领域,一方面要强调数据的预先布局,将承载离线、非实时、备份等业务的算力布局在西部,将承载实时性业务的算力布局在东部,做到东西算力协同。另一方面,要强化数据贴源处理和分层管理,对于能就近处理的原始数据,可在区域数据中心就近加工,降低网络传输压力。总体上要统筹考虑数据源分布、数据价值密度、数据服务时效性、算力布局,做好数据架构的总体规划。
二是如何在“东数西算”新格局下继续保障数据生产的高效性。随着“东数西算”的推进,数据采集和加工呈现多区域分布的特点,传统的大数据技术架构难以承载跨中心数据统一处理需求,必须要创新构建新型大数据基础设施:一要算力协同,具备对分布在不同区域中心的计算任务统一调度管控的能力;二要统一治理,具备对物理分散、逻辑分层的数据实施统一元数据管理的能力;三要统一服务,具备在新型复杂架构下用户服务体验保持一致的能力。总体上要综合运用分布式协同计算、湖仓融合、存算分离、大数据PaaS等技术,做好大数据计算架构的整体升级。
三是如何在“东数西算”新格局下继续保障数据安全性。算力网络具有算力泛化、融通东西、算网共生、灵活连接等特点,将会产生更多的资产暴露面和更高的连接频次,数据传输的规模更大,路径更多,服务面更广,数据安全风险也随之增加。企业需进一步加强数据安全管理,通过数据分级治理,体系性提升数据安全防护水平,持续完善安全治理架构。
中国移动立足自主创新,构建大数据分布式协同计算新架构,推动“东数西算”逐步落地。
为应对大数据领域面临的挑战,更好地实现大数据场景下计算、存储向西部的高效转移,除了要充分发挥传统运营商优势,构建大带宽、低时延、智能化、安全高效的传输网络,中国移动大数据中心还结合业务发展,运用贴源计算、协同计算、存算分离、湖仓融合等新技术新思路,积极推进大数据基础设施架构全面升级。
随着数据规模逐年增长,中国移动原有物理集中的大数据平台难以承载持续增长的业务压力。为满足全网日益增长的业务需求,中国移动大数据中心创新性规划构建大数据分布式协同计算平台,将原有物理集中的计算架构升级为分布式多中心协同计算的处理架构,实现海量数据的分布式贴源处理,解决了业务集中承载难、优秀能力推广难等问题。计划到2023年底建成包括贵阳、重庆、呼和浩特等西部节点在内共九大区域中心的大数据分布式协同计算平台,接入中国移动全网数据,高效支撑大数据业务创新发展。
中国移动大数据分布式协同计算平台的建设是中国移动在结合自身业务发展的前提下,为“东数西算”的全面落地做好技术储备和初步验证的重要工程。中国移动大数据中心坚持自主创新,突破跨中心两级协同调度、智能调度、跨DC高速传输、协同计算等多项技术难题,已完成中国移动大数据分布式协同计算平台1.0版本研发,具备一点触发、多中心协同计算的能力。
在数据分布管理层面,构建数据分层管理体系,按层次按热度进行数据的统筹分布管理。明细数据实时就近接入区域中心实现贴源处理,离线汇总数据向西部统一汇聚、计算,满足多场景数据时效要求。
在技术架构层面,一是构建统一元数据、统一开发调度能力,实现任务一点编排,多中心协同调度;二是构建协同计算引擎,实现基于执行计划拆分、算子下推的跨域计算及分析;三是构建统一资源管控层,实现对多中心的分布式资源进行统一管控统一开放能力;四是应用大数据存算分离、湖仓融合架构,实现多模态数据的一点接入,随处可见、随处可算。
在安全管理层面,全面落实三法一条例要求,构建全方位全流程数据安全管控体系,进一步强化跨中心数据流动一致性稽核能力,具备完备的敏感操作拦截、敏感日志审计、敏感数据加密等能力,确保全生命周期数据安全。
当前分布式协同计算架构已在宁波、苏州、汕头、株洲、郑州五大区域节点完成平台部署,支撑位置洞察、内容洞察等应用创新,实现中国移动近三分之一的大数据算力分流。2022年,中国移动大数据中心将进一步在贵阳、重庆、呼和浩特、哈尔滨等区域节点开展平台建设工作,并持续开展技术创新,强化数据智能分布管理,动态感知各数据中心资源使用情况、数据“冷热”规律、业务容灾需要,实现基于资源状态和业务特点的数据副本跨域智能分布、作业智能化调度,高效释放数据要素价值,有力支撑“东数西算”的全国布局。
未来,中国移动大数据中心将紧抓“东数西算”历史机遇,践行自主创新,持续做大做强做优大数据分布式协同计算平台,构筑大数据计算平台领域核心竞争力。同时中国移动还将借助超级工程的广泛影响力,进一步发挥产业引领作用,协同产业合作伙伴,体系化推进大数据产业基础设施革新,全力服务国家“东数西算”战略工程顺利落地。