以数据为核心的近数据计算,「深存科技」计算存储处理芯片及解决方案加速突破数据中心算力瓶颈
【慧聪通信网】大数据时代下,愈发繁重的数据量和数据处理需求正在给各行各业带来巨大挑战。据惠普在其发布的研究报告中预测,至2025年需要被分析和认知的数据将增长100倍以上。
尤其是在摩尔定律逐渐逼近物理极限的大背景下,行业难以再通过制程工艺的迭代来提升芯片性能、降低成本。因此,人们开始思考如何从半导体材料、封装工艺、计算架构等方向,寻找到新的突破口。
数据处理能力的需求已经远远超过算力的增长
在创新计算架构上,国际存储网络工业协会(SNIA)早在2018年11月成立计算存储技术工作组,集合业界主流的计算和存储企业,共同探讨数据核心计算的技术与应用,制定相关标准。其中定义了三种计算存储技术路径:
Computational Storage Drive(CSD,即可计算型SSD,包含持久存储和计算模块);
Computational Storage ProCESsor(CSP,即不含持久存储,但将算力部署在数据端的处理器);
Computational Storage Array(CSA,即整合计算存储处理器、控制软件及其他器件的整套混合方案)。
其中,CSD更适用于低算力低功耗场景,已有包括三星在内的多家SSD厂商进行实践和部署。但对于数据中心复杂场景、高通量、低延时的海量数据加速需求,作为独立应用芯片的CSP则成为更行之有效的实现方案。
截至目前,包括三星、西部数据、海力士等主流存储厂商,以及英伟达、AMD、Intel、戴尔等主流计算企业共51家公司已加入SNIA技术工作委员会。
实际上,除了国际巨头在计算存储计算领域有所布局,国内深存科技亦是这一赛道中不可小觑的创企玩家之一。
深存科技成立于2020年11月,是国内首家近数据大算力CSP芯片及解决方案提供商,聚焦以数据为核心的计算目标(Data Centric Computing),研发与存储系统紧密结合的计算存储处理器/数据处理芯片(CSP),能够为下一代数据中心、5G边缘计算、云计算等数据繁重的应用场景提供核心组件,满足低延时、高精准的要求,解决“大数据”和“快数据”并存的难题。
深存科技创始人&CEO袁静丰告诉36氪,公司的主要出发点是从第一性原理出发,把算力部署到离数据更近的地方,以数据为核心展开计算。“搬运计算资源比搬运数据更容易,效率也更高,在未来数据中心领域将会产生巨大的数据盈利。”他说。
01、团队产业化经验超20年,今年底将发首款正式量产大算力产品
“我们的主要目标是做改变数据层面和存储端算力架构的探索,为未来以数据为核心计算的技术方案做更多革新。”袁静丰说。
他谈道,存储及数据服务器在过去很长的时间里一直处于“被动”状态,仅仅注重容量和读写服务,而深存科技希望将它改变成一个具有数据认知、结果产出能力的“自动驾驶”系统,形成以数据为核心的计算,成为智能化的数据湖,面向未来数据繁重的应用需求,包括数据中心、流媒体、自动驾驶等领域。
从公司成立以来,深存科技相继推出了基于FPGA的算法原型机、工程样机,到目前已准备量产的产品样机,而这迅速的研发节奏与公司团队背景息息相关。
一方面,公司核心团队来自西部数据、 美光、惠普研究院、英特尔、微软Azure数据中心、英伟达、腾讯等知名企业,拥有20年以上存储控制芯片、数据加速芯片、GPU算力芯片和国际领先的数据中心、超算架构的研发经验,成功迭代并量产多个数据中心核心芯片项目。
其中,深存科技创始人&CEO袁静丰曾任职英特尔、美光、闪迪、西部数据等公司,作为企业存储和数据中心业务的资深专家、Fellow候选人,负责数据中心业务芯片及系统的研发,并参与企业存储、数据加速、计算存储、存算结合等方向的研究和相关标准制定,拥有十余项芯片领域的国际专利。
在20多年的从业经验里,袁静丰曾带领团队连续研发且交付过多个业界领先的芯片及系统级产品,并规模部署至AWS、Facebook、微软Azure等大型数据中心,以及DELL/EMC、HPE、IBM等国际厂商的主流服务器。
基于丰富的产业化落地经验,深存科技通过与客户进行深入接触和沟通,能够快速将客户的创新需求转换成产品来落地,沿着近数据计算的重要趋势不断深耕布局和应用。
具体到产品规划上,面对动辄几十TB到PB级的数据中心数据湖存储节点,深存科技预计将在2022年第四季度推出第一款正式计划量产的大算力CSP产品,将强大算力和数据存储系统进行深度整合,定位面向数据中心的高性能产品线,涉及云计算,视频流媒体服务、工业互联网等应用场景。同时,公司在智能制造领域已拓展了重要合作伙伴,接下来将进入具体的合作与落地阶段。
随着产品的量产及落地推进,公司也将快速搭建市场销售团队,同时继续大规模扩展研发人员,以更好地在产品开发上投入大量的时间和精力。
02、计算以数据为核心,率先与AMD形成合作伙伴体系
实际上,随着近年来行业应用对芯片算力、能效等性能要求越来越高,传统的冯·诺依曼架构作为典型的以CPU为中心的结构,其计算和存储分离的设计导致“存储墙”问题愈发明显。为了解决这一问题,最初不少玩家选择采用存算一体的方式解决,包括存内计算、近存计算等技术路径。
袁静丰认为,存内计算更多是从微观层面进行架构的优化,例如在存储器中部署神经网络来解决AI层面的参数及向量搬运的需求,相比基于ASIC或GPU的设计,存内计算在效率方面有更好的提升。
同时,存内计算面临的更多是存储器设计和制造的挑战,“这不是一家小公司或初创公司能够主导和控制的,往往需要大厂乃至整个产业链的参与来提供完整的支持。”他说。
相比之下,通过CSP芯片实现的近数据计算更多是从宏观架构和芯片设计层面进行创新和优化。例如在数据中心,应用往往要面临大量原始数据的搬运,需要从存储节点通过网络往计算节点进行搬运,就像一台计算机,但是更为复杂和庞大。
高带宽和低延时的应用与庞大数据需求,形成巨大的引力将计算资源拉近数据
在袁静丰看来,未来数据中心将面临大量的数据增长,相比以往大家关注的庞大数据容量和通量,它将更强调响应时间,对数据的实时性要求越来越高,也就是快数据需求。这就使得数据周围形成巨大的引力,促使计算资源向数据靠近,以数据为核心的计算(Data Centric Computing)成为继基于GPU的计算加速,DPU/IPU的网络加速之后的重要趋势,围绕数据湖展开数据加速和算力部署的计算存储将是未来业界的主要工作。
2022年5月,服务器厂商戴尔表示以数据为核心的计算存储是未来重要趋势
因此,行业除了增加算力和网络带宽投入,更要思考如何提升数据中心的存储和数据处理效率的问题。“用行业公认的观点来说,提高计算效率的关键就是提高搬运效率,搬运计算能力会比搬运数据更有效。”袁静丰说。
这也是深存科技选择用近数据计算架构来解决存储和计算冲突的关键所在。通过将CSP和存储节点相结合,达到以数据为核心的近数据计算目标,能够在减少原始数据的低效搬运基础上,实现低延时、高精准、快速反应的效果,同时让AI算力在数据最近的地方发挥效率。
总的来看,深存科技的CSP可提供强大的数据加速能力、高效的I/O处理能力,以及强大AI算力,让应用缩短数据搬运路径,提高计算效率,实现低延迟、高精准、高通量。与其他CSD计算存储公司相比,深存科技采用了CSP+存储节点的部署方式,CSP可独立工作,可部署近数据的大算力应用和通用化的多元场景。
“我们最大的差异化在于将算力做到了极致,将加速能力和AI算力整合在CSP中,放到存储节点附近来完成以数据为核心计算和加速的目标。”袁静丰谈道,不管是在成本效率、通用性,还是综合算力方面,深存科技的芯片产品均已超过头部玩家的同类产品。
目前,深存科技已得到一些业内知名公司的认可,与AMD形成合作伙伴关系,这一合作是国内数据中心存储与算力融合领域的首例。与此同时,公司即将成为全球网络存储工业协会的技术工作组标准委员会成员,未来将和其他主流公司共同参与行业技术标准的制定。