100us级超低延迟与120万IOPS超融合解决方案是如何炼成的?SmartX给出答案!
副标题[/!--empirenews.page--]
至顶网计算频道 06月22日 新闻消息(文/李祥敬):近年来,超融合技术已经成为现代数据中心流行的基础架构解决方案。凭借其架构简单、易于扩展等优势,超融合应用范围越来越广泛,从VDI、研发测试等场景逐渐扩展到生产环境。 而随着工作负载类型的变化,相对于物理机和全闪磁盘阵列方案,用户对基于虚拟化平台的超融合系统性能延迟还存在顾虑,导致核心系统始终未被整合到超融合系统当中。 为了解决这样的难题,SmartX正式发布基于核心软件SMTX OS与英特尔傲腾持久内存的高性能、低延迟超融合解决方案与SmartX Halo P系列一体机。 SmartX在业内首次将英特尔傲腾持久内存以App Direct Mode (应用直接访问模式),并作为核心组件用于超融合解决方案中。与此同时,通过对计算虚拟化、存储网络以及存储介质的端到端优化,以有限的计算资源获得业内领先的高性能与超低延迟服务器虚拟化存储性能。在集群测试中,只需要3个节点P系列一体机,即可达到120万的IOPS ,同时,应用端延迟保持在100us以下。 傲腾是英特尔推出的全新存储技术,其中傲腾持久内存就是以内存形态封装,支持像普通内存一样插在内存槽使用。 英特尔傲腾持久内存在内存和SSD之间新增加了一个存储层级,具备像内存一样的超低访问延迟,超高寿命与可靠性,同时还具备持久化存储和按字节访问的能力。在App Direct模式下,特定的应用程序可直接访问由英特尔傲腾持久内存带来的独立持久内存资源。 SmartX 联合创始人兼CTO张凯表示,基于英特尔傲腾持久内存的高性能,低延时,非易失等特性,SmartX希望打造以英特尔傲腾持久内存作为缓存,NVMe NAND SSD作为存储介质的全闪超融合解决方案。这个方案将大幅度改善业务系统延时,使得SmartX 产品可应用于对延迟要求最苛刻的核心业务。 张凯说,从成立开始,SmartX就非常关注性能,因为性能对于客户来说是一个非常有价值的指标,决定了可以支撑的业务类型,比如核心业务系统对性能要求非常高,如果说你的性能无法达到,就无法迁移到超融合系统上面。 所以,2019年SmartX启动代号为Sailfish(旗鱼,海洋中最快的鱼类)项目,将英特尔傲腾持久内存App Direct模式用于缓存加速,同时对 SmartX超融合软件SMTX OS进行全方面优化。 高性能、超低延迟的进化之路众所周知,超融合带来的敏捷性、便捷性、易用性、可运维是被广泛认可的情况,很多行业客户开始大规模采购超融合系统,这已经证明超融合相比传统架构具有很大的优势。 但是问题也来了,相比裸金属服务器和中高端存储设备,在性能上,尤其在延迟上超融合是不是可以和传统架构一决高下,很多客户是有担心。“基于英特尔的全新存储硬件产品,我们从硬件到软件对整个系统进行了升级,充分发挥软件和硬件结合的优势,从而让超融合在性能上已经达到甚至是超越传统中高端存储所达到的性能。”张凯说。 为了充分发挥傲腾持久内存的能力,Sailfish项目对计算虚拟化到存储网络以及存储介质进行了端到端优化。而由于超融合架构的部署特点,以上的性能都必须在有限的计算资源实现,这一限制条件为Sailfish项目带来诸多的挑战。 张凯表示,在现有SMTX OS软件栈中,一个IO请求会经过:计算虚拟化层、网络层和存储层。IO请求在经过每一层系统时,都会带来额外的性能开销,这些性能开销来自于上下文切换,系统中断以及内存拷贝等等。为了充分发挥傲腾持久内存的性能,解决方案对这三个层次分别进行优化,以做到端到端的IO加速。 基于此,SmartX研发团队对系统进行了如下重大改进,SMTX ZBS分布式块存储专门开发了以DAX(Direct Access)模式访问持久内存设备的适配程序,缩短了IO堆栈以获得更佳的性能和更低的延时。 为了保证在有限的CPU资源下提升持久内存的带宽性能,SmartX技术团队创新地引入了IO/AT DMA引擎实现了异步写入持久内存的机制,使得单个CPU内核的最大写入带宽提升至10GB/s。 在存储层,Sailfish项目充分发挥英特尔傲腾持久内存App Direct模式低延迟和持久化存储的能力,保存集群中最经常被访问的数据。同时为了保证数据的可靠性和高可用特性,缓存的数据也会以副本的形式保存到其他的节点中。不仅如此,SMTX OS充分利用持久内存的字节访问特性重新设计了日志,有效解决日志写放大问题。并通过DMA方式,将内存与持久内存之间的数据拷贝任务,下放到硬件中完成,极大地提高了内存拷贝的效率,在提升存储性能的同时,不产生额外的CPU资源需求。 在计算虚拟化层,通过SMTX ELF Boost模式将存储虚拟化功能,从虚拟机中下放到存储软件栈中,避免了因IO请求经过虚拟机而产生额外的性能开销。同时通过VM与存储系统共享内存的方式,避免在IO路径上发生内存拷贝,直接通过vHost技术将虚拟机内存中的IO数据直接共享到ZBS上的vHost Target。 在存储网络层,通过使用RDMA over Converged Ethernet(RoCE )进行网络IO加速,并将网络协议的实现部分,下放到网卡硬件上完成,充分利用网卡硬件的加速功能,极大地降低分布式存储在网络通信时的性能开销。 “经过以上优化,我们在IO性能提升了3.2倍基础上,在延迟上有85%的降低。这是我们Sailfish项目带来的价值,使用该方案,SmartX超融合一体机三个节点的最小系统即可达到120万IOPS,而且虚拟机端的IO延时可从ms级别降低至us级别。”张凯说。 目前,Sailfish项目中使用到的技术已经集成到了最新的SmartX Halo P系列一体机中。SmartX Halo P系列一体机不仅能够胜任交易类数据库、机器学习等对IO性能要求苛刻的核心应用场景,并且能够以更高性能提升虚拟机密度,进一步简化IT部署,降低整体拥有成本。SmartX Halo P系列一体机已经在金融行业进行了测试和部署。 (编辑:52站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |