Cloudera Data Platform:Cloud 2.0 时代的企业数据云平台
【慧聪通信网】近年来,中国互联网和云计算正飞速发展,相关政策的出台也进一步推动企业迈向数字化转型。上云是大多数企业数字化转型的第一步。随着企业数据量的增长和对IT系统安全性要求的提高,单一云部署逐渐无法满足企业的全部需求,多云是最被看好的部署模式。
多云在保证低成本高性能的同时,能够让数据和应用在公有云、私有云和本地部署之间无缝迁移。为了助力多云部署灵活高效运作,市面上出现了一类新兴产品。今年1月,Gartner为定义这类产品提出了“云数据生态系统”的概念。去年年底,分析公司451Research将它们称为“企业智能平台”。而Cloudera所推出的ClouderaDataPlatform(CDP)正是“企业数据云”类别当中最全面的数据平台。
可以说,我们正式迈入了Cloud2.0时代。
从单一云到混合云部署
在早期,很多企业被公有云承诺的无限按需存储和计算能力吸引,又迫不及待地想摆脱本地数据中心的成本负担和局限性,纷纷加入了上云大潮。但随着企业的发展,公有云的性价比逐渐到达了临界点,甚至成为企业发展的“枷锁”。
这其中有两个主要原因。首先,企业被锁定在长期合同中。他们在没有搞清楚自身到底需要多少性能之前便签下了看似优惠的合同,导致实际支付费用比预想的更高。有些企业只应用了他们所购买性能的一部分,造成了资源浪费;有些则低估了其所需存储空间和计算量,导致了不菲的超额收费。其次,企业要把公有云上所有相关元数据完整地迁移回本地十分困难。但是,如果放弃历史记录和其他描述性的相关数据,将会极大降低今后数据分析的价值。
为了摆脱“枷锁”,企业开始转变云策略,比如加大对私有云的投资,采用外包第三方数据中心,甚至回归最原始的本地数据中心建设。为了能够最大程度地利用自有资源,企业仅在绝对必要时才将数据移至公有云。
面对企业的需求变化,云供应商纷纷推出混合云解决方案。去年下半年,美国三大公有云厂商相继推出了将其服务扩展到私有云部署的方案:AWS推出了AWSOutposts混合云架构服务;微软于2017年首次推出了混合云解决方案AzureStack,而最新发布的AzureArc进一步扩展了AzureStack的功能,能够在任何基础架构上运行;谷歌也公布了混合云平台GoogleAnthos。
多云时代的混合云数据管理
企业对于云厂商的服务扩展喜闻乐见。但是上述云厂商几乎都只是将平台从公有云服务延伸到其自有产品的私有云和本地部署数据中心,并没有一家可以帮助企业跳出云厂商各自的服务和产品领域,更不用说采用竞争者的云架构。尽管云厂商都在大力宣传他们在云平台之间、从公有云到私有云或本地的灵活移动性,实际效果却并非如此。
Cloudera行业解决方案副总裁Cindy Maike表示:“企业希望能够通过统一的平台界面来管理一切,既能灵活访问数据,也能将工作负载放在最能创造价值的地方。如今,企业想要知道他们在跨平台时,到底可以移动得多快。”
此外,机器学习和商业分析在跨云环境部署中的应用也颇受企业关注。现在有的供应商能帮助企业在不同云部署中编排机器学习项目,有的能够跨混合云和多云部署协调数据。而Cloudera的独特之处在于,其最新的企业云数据平台Cloudera Data Platform能够同时提供数据管理和机器学习,这也得益于一年前与Hortonworks的强强联合。该平台的核心能力在于拥有一致的管理功能,能够帮助企业设置和维护元数据参数,并实现跨多个云平台且安全合规的数据分析。毕竟,只有当数据和应用能够灵活移动时,我们才能实现真正的多云部署,这也是Cloud2.0时代真正的灵魂内核。