这意味着超车机会来了对很多人来讲,CIPU是一个陌生的词汇,但如果谈到CPU,大家可能就会感觉熟悉的多,毕竟对于有着“计算机心脏”之称的CPU来讲,大家都很清楚它在整个计算机运行中对数据处理起到的重要作用。
那么问题来了,在拥有CPU情况下,为什么我们还需要CIPU呢?
原因很简单,因为CPU实在太“忙”了。
在过去十几年来云计算技术的发展过程中,CPU最开始是毫无疑问的“C”位。
在最初发展阶段,分布式技术占据主导地位,互联网企业开始将业务从传统的大型机向分布式系统迁移,打下了分布式架构的底座,满足了企业业务扩展带来的弹性算力。
而在资源池化技术出现,计算存储分离的架构真正得到了实现,相较于过去相对死板的存储模式,资管池化技术对资源进行了再规划编排和调查,计算存储池得到了扩充。
总得来讲,在这两种以CPU为核心的技术出现后,云计算的可靠性和可用性迈上了一个台阶。
但随着云计算的高速发展,CPU维持“C位”就显得有些力不从心。
时至今日,以大数据应用为代表的数据密集型场景越来越多,特别是在元宇宙概念提出之后,这种以CPU为中心的传统架构便开始暴露出了短板:
第一个短板是慢。
以阿里云为例,其在全球27个国家和地区、84个可用区管理着上百万台服务器,如果按照以CPU为中心的架构,那在数据的处理和传输中就很容易出现延时问题,进而直接给使用者造成不便,甚至在给部分需要高度数据及时性业务的客户带去损失。
第二个短板是庞杂。
在大数据应用逐渐增多的情况下,数据中心内部数据迁移和储存量都是在不断拉大的,而在对CPU为中心的架构来讲,它很难提供能够满足数据储备的高带宽。
针对这两项短板,硬件厂商英伟达和英特尔分别开出了DPU和IPU 的药方。
DPU侧重解决的是数据迁移带宽的问题,做的是集成加速平台,即对CPU部分功能进行卸载,优化,减轻CPU的负担,主要解决第一个短板。
而IPU更强调虚拟化云化能力,通过网络虚拟化、存储虚拟化、网络存储管理以及安全等功能,加速网络基础设施,释放CPU核来提高应用程序性能,主要解决第二个短板。
虽然说硬件厂商给出的“良药”确实对解决当下云计算领域内的困境起到一定作用,但对阿里云这样的云厂商来讲,比起在云化虚拟化管控数据中心和数据迁移带宽这俩方面做二选一的抉择,阿里云选择了“我全都要”的解决方案。
只要小孩才会做选择,大人的世界是尽善尽美。
于是CIPU应运而生。
在阿里云自主研发下,云基础设施处理器(CloudInfrastructureProcessUnits)替代CPU成为云计算体系架构的中心,也是阿里云为其独有的飞天云操作系统设计的专用处理器。在应用上,CIPU向下云化管理数据中心硬件,并对计算、存储和网络资源进行加速,向上接入飞天云操作系统,将全球200多万台服务器变成一台超级计算机。
而在CIPU和飞天操作系统的新一代云计算架构体系,无论是在分布式应用还是人工智能的场景测试中,都展现出强大性能优势。
存储方面,CIPU通过全硬件虚拟化和转发加速,存储时延最低可至30us(PLX),IOPS高达300万,存储带宽可达200Gbps,全面超越市面上所有云产品。同时,还支持云上多计算节点NVME共享访问云盘块存储,OracleRAC、SAPHana等高可用数据库可以无缝上云,这也是全球范围内的首创。
网络方面,CIPU将基础带宽从100G升级至200G,VPC的PPS转发性能从2000万提升至4000万,网络时延从22us降低至16us,RDMA协议下更可低至5.5us。应用上云之后,比自建物理机的集群吞吐量提升了30%,业务高峰期延迟下降了90%。
计算方面,单容器虚拟化消耗减少50%,虚拟化容器启动速度快350%。主流通用计算场景下,Nginx性能提升了89%,Redis性能提升了68%、MySQL提升了60%。大数据和AI场景下,AI深度学习场景训练性能提升30%,Spark计算性能提升30%。同时,神龙计算平台可以提前预测80%的硬件故障,并进行无感热迁移规避,从而实现了业界领先的高可用SLA。
而CIPU 的最大意义还不止于性能。
作为CIPU背后的云厂商,阿里云此番技术发布,也扣上了云计算技术国产化在新阶段的重要一环,它不仅代表着我国国产云厂商的技术体面,更有望打破以CPU为中心的传统云计算体系架构,定义新一代云计算基础技术,
CIPU,云技术的一小步,阿里云的一大步,国产云的大跨步。
网友评论