深圳幻海软件技术有限公司 欢迎您!

金山云混合云存储,构建数据驱动型组织的核心竞争力

2023-03-20

云计算驱动的数字化浪潮席卷了所有行业。计算、网络、存储被称为云基础设施的三大件,存储又是其中变化最快的一项,这是因为随着数据驱动型组织战略的普及,云计算、移动互联网、物联网、大数据、人工智能等新技术在各个领域深化应用,全球数据量呈爆炸式增长态势。IDC的研究报告显示,全球数据圈(以数据圈代表每年被创

云计算驱动的数字化浪潮席卷了所有行业。计算、网络、存储被称为云基础设施的三大件,存储又是其中变化最快的一项,这是因为随着数据驱动型组织战略的普及,云计算、移动互联网、物联网、大数据、人工智能等新技术在各个领域深化应用,全球数据量呈爆炸式增长态势。IDC的研究报告显示,全球数据圈(以数据圈代表每年被创建、采集或是复制的数据集合)将从2018年的32ZB增至2025年的175ZB。全球数据量爆炸增长,为数据存储市场带来巨大增量。在这样的背景下,现有的数据存储模式已经难以满足数据存储要求,数据已经由原来存储在专有的集中式存储设备上而向云存储(公有云、私有云、混合云)上转型,以降低固定资产支出和运维管理费用,以激活数据来驱动组织的业务创新,注入持续发展的源动力。

其中,混合云存储是一种将公有云存储服务和私有云存储资源互联互通的技术实现,促进云上和云下的数据双向互通。混合云存储越来越受欢迎,充分发挥公有云的超大规模、弹性扩展、随需而用和低成本优势,以及私有云的资源物理隔离和安全合规的特点,业已成为数据高效存储的发展方向。

技术立业的金山云存储产品线

早在2007年,金山就开始筹建金山实验室,进行云存储技术领域的研究。2012年,金山将云存储业务进行拆分,成立金山云公司。同年,金山云正式在国内推出在线云存储服务KS3,为用户提供优质的互联网对象存储服务。此后,金山云存储产品的不断迭代演进、推陈出新,陆续推出功能丰富的各种存储产品及服务。金山云主要云存储产品包括:对象存储(KS3)、弹性块存储(EBS)、文件存储(KFS)、归档存储(KArchive)及混合云存储产品系列(KingStorage)。

金山云的对象存储KS3,已经在线稳定运行超过十年,云上规模超EB级,且每年都保持着高速增长,是业内技术先进的超大规模公有云分布式存储服务。在私有化部署的场景下金山云提供KingStorage混合云存储产品,继承了公有云存储的架构与功能优势,并充分考虑并实现私有化场景下客户业务对存储的个性化需求。依托于金山云混合云存储优秀的架构设计,保障了业务能力的稳定输出,具备大规模的数据存储与处理能力,聚焦于云原生应用、大数据存算分离、自动驾驶、机器学习、视频云等业务场景。在IDC发布的《中国软件定义存储(SDS)2022年第一季度》报告显示,金山云KingStorage OBS产品在SDS对象存储市场细分领域,市场占有率位列前三,已跻身于国内行业头部。

以云为基的云原生存储

金山云KingStorage混合云存储产品是基于云原生的设计理念,定位于混合云、专有云、云化的企业数据中心和边缘计算节点等场景,旨在为客户提供弹性伸缩、软硬解耦、资源隔离、随需而用、敏捷高效、自动化运维的池化存储资源。其主要特点有如下:

应云而生 — 源自云:产品研发源于云用户对数据存储的多样化需求,解决数据存储在公有云和私有云中流转的问题。

以云为基 — 兴于云:产品基于公有云相同的存储技术栈,并实现代码共享,基于应用场景差异提升企业级存储的功能特性。

融云致远 — 赢未来:面向云原生应用对海量、高性能存储的需求,强化与各类云原生平台的平滑对接,助力云原生生态的繁荣。

KingStorage云原生的特质有利于平滑对接多云平台和满足云原生类应用的存储需求,实现数据在多样化应用场景之间按需流转,确保云上云下一致的存储服务体验,加速业务创新和数字化转型。

聚焦新兴业务领域下的存储痛点

在当今新业务形态下,客户对于存储的核心需求主要有三点:第一是新业务场景对存储的高性能需求,比如在自动驾驶、机器学习、大数据分析等场景,高算力下的海量数据存储性能日益成为制约业务发展的瓶颈。第二是业务数据的超大规模已是常态,而现有的存储模式显然难以满足,比如基于开源存储软件的方案,会遇到节点规模扩展后性能低远于预期、扩展后难以符合设计预期、版本更新快且难于在线升级、运维复杂等各类意想不到的问题。最后是要实现项目总体上的降本增效,业务数据要能够做到线上线下按需流动,充分享受云上计算和存储资源的廉价。以自动驾驶业务的需求为例,典型的以数据驱动业务量变的新产业,L4级自动驾驶需要大约300PB~500PB的路采数据,但是更多的场景数据能提升模型的精准度。此外,业务所需的高精地图和测绘数据是涉密的,按照保密要求必须保持在合规的私有化环境中。而机器学习可按需按时采用公有云上大量的GPU服务器资源,同时需要云上和云下的数据互通来驱动训练任务的开展。

大数据存算分离应用场景实践

随着大数据应用被越来越广泛的应用到互联网企业、金融、运营商等行业,并逐步成为业务发展的主要推动力。这就带来用户数据量的指数级增长,数据的规模已经突破之前的预期,这不仅带来高额的成本,同时原有的数据存储技术架构也不能有效地支撑大数据业务,进而影响到业务的创新。为了解决新业务形态下存储模式面临的挑战,越来越多的客户选择了存算分离的方式。

存算分离需要解决用户面临的三大难题:业务运行慢、系统维护难、存储方案贵。首先,当前采用的HDFS存储的设计存在内存占用高、使用粗粒度的全局锁、以及对小文件的处理效率低、数据处理的过程出现延时高的问题。其次,HDFS存储仅能支持数亿级别的文件数,超过之后一方面需要做深度优化提升,另一方面是采用新的版本来提升对文件数的支持,而新版本的稳定性通常比较差,带来系统级的运维难题。最后是HDFS的存算一体和三副本机制,使得存储空间的利用率低于33%,且扩容时必须计算节点和存储节点放在一起,导致数据规模越大存储方案需要的资金投入就越高。

金山云混合云存算分离解决方案,提供三种灵活的大数据对接模式:一是基于具备缓存加速能力的大数据存储网关组件,二是采用定制优化的Hadoop sdk对象存储插件,三是使用标准的s3a协议,满足不同应用场景下大数据生态软件对接存储的性能和功能需求。其中大数据存储网关组件,不仅兼容HDFS协议,还支持全局缓存和统一命名空间,提供弹性伸缩的数据存储能力。对于计算类应用,可以提供很好的数据本地化或加速数据I/0性能;对于后端的持久化存储系统,可通过统一命名空间功能融合多套异构的存储系统,且对前端计算框架的使用做到透明。

通过在头部商业银行的交付实践表明,金山云混合云存储分离解决方案在性能、兼容性、成本、以及规模化扩展能力等方面得到认可,并在行内广泛推广,促进大数据类业务的创新和引领行业的技术发展趋势。

机器学习应用场景实践

通过深入分析机器学习场景下各流程环节对存储的需求点可以发现,用户对存储的需求有如下四点。首先是性能,即是否能以最快速度和最优成本满足自动驾驶不同流程环节的数据高速读写的要求。第二是扩展性,系统整体扩展能力和扩展的便捷性,决定了系统是否支撑未来2~3年的业务增长对存储系统的容量需求。第三是云原生的需求,机器学习的场景下,一定会基于云原生平台来构建业务运行体系,这就需要存储系统提供CSI容器存储接口(CSI:Container Storage Interface)插件,并且具备CSI存储插件的高可用和故障自愈等能力,在确保数据安全性的同时,全面提升存储服务的可用性。第四是成本因素,希望降低长期存储运营成本,实现冷热数据的分离,冷数据的存储成本能进一步降低,优化数据生命周期过程的每TB成本。

结合用户的需求以及对存储系统的长期实践,金山云针对机器学习场景下推出三种混合云存储解决方案,涵盖文件存储、对象存储以及相应的高性能存储网关产品。一是为中小型客户提供一体化文件存储系统,完全具备支撑机器学习的功能特性和性能,并具备良好的性价比。二是针对性能有极高性能要求的用户,金山云提供基于全闪存的文件存储解决方案,性能上支持数百GB的大吞吐量和亚毫秒级的低延时。三是面向泛互和公共服务领域的用户,则推荐高性能存储网关+大容量对象存储的解决方案,构建起存储资源池,实现机器学习、大数据分析、云原生应用数据的统一化存储。

在金山云的项目实践中,机器学习的数据量已超过百PB以上,主要是超大规模的视频图片类数据,并且每年保持着高速的增长。同时,该用户内部有很多关联业务系统,对于在线日志保存、大数据分析、数据归档等都有存储需求,更重要的是机器学习已成为驱动主营业务的关键要素。金山云凭借本地对象存储资源池加上高性能的存储网关,提供了机器学习的整套存储解决方案,解决存储的性能瓶颈,降低运营成本,帮助用户实现了新业务的快速上线,并驱动核心业务的不断创新。

让混合云存储的特质驱动业务创新

为构建数据驱动型组织的核心竞争力,各行各业创新性地对业务进行优化和改造,提升业务敏捷性和服务化能力,同时选择适合自身业务的数据存储方式,来释放海量数据的潜在价值,提升数据在业务间的流转能力,并实现降本增效的目标。作为中国云服务市场的领导者之一,金山云在混合云存储产品与解决方案已得到金融、运营商、泛互企业、公共服务等用户端的正式商用和服务认可,将持续帮助用户解决在业务转型过程中面临的各种数据存储挑战,充分释放数据价值,驱动业务的高速增长。

金山云云存储产品负责人​​​​表示:混合云存储作为金山云存储业务重点的发展方向,聚焦在云原生应用、大数据分析、自动驾驶、机器视觉等新型应用场景。依托于公司的云存储技术栈和云上存储服务的业务实践,结合企业级用户在业务对接、安全合规、极简运维等方面的需求,金山云将不断完善混合云存储产品线,丰富功能特性,促进云与端之间数据的互相流转,让混合云存储的特质惠及云上云下的用户。

展望未来,金山云混合云存储一方面将持续不断地构建高性能、高弹性、易运维的产品核心竞争力,另一方面将与头部用户及行业ISV携手共创,率先在业内推出创新性的云原生存储解决方案,携手生态合作伙伴共同推进混合云存储市场规模的高速发展。