2020年9月,国务院国资委正式印发《关于加快推进国有企业数字化转型工作的通知》,系统明确国有企业数字化转型的基础、方向、重点和举措,基于2020年新基建元年,新型数据中心的大规模建设,进一步为国有企业数字化转型提供了坚实的基础。
在积极推动数字经济发展的进程中,云南省提出了“数字云南”战略,云南移动以5G等新基建为先进生产力,联合华为积极构建全新的网络联接来助力数据中心的云化,从而加速云南移动的数字化转型进程。
云南移动布局5G背后的数据中心挑战
近几年,云南移动的业务增长非常迅速,服务对象覆盖近四千万个人用户,一千万家庭用户,四十多万的政企用户。
于此同时,我们必须要唯物客观的看到,绝大多数的政企客户的信息化系统、数据中心建设、网络构建都不是一蹴而就的,而是不断增加和改进的。云南移动数据中心也是走过“竖井式构建、紧密耦合”过去,经历了向“中心化、分层开放” 的过程,最终目标定位于构建“智慧中台和切片运营” 的架构体系的过程。
比如云南移动BOSS系统月计单数2016年相对于2020年增长了10倍,达到了一千亿条。服务器需求也从2018年的3千台增加到2021年的1万台,这些增长造成了带宽不足、数据中心机房的扩展和运维效率数据中心网络的挑战。
“原本的数据中心,分布在玉溪、昆明、曲靖 三个城市,业务各自部署,是传统的烟囱式架构,曲靖和玉溪间相距200km,数据中心互访需要出数据中心,走公网,流量绕行严重;老数据中心的可用空间和供电能力,也达到了上限;并且传统网络出故障几率大,人工维护很低效。无法满足我们日益增长的业务需求。云南移动数据中心网络升级迫在眉睫。” 云南移动信息技术部总经理于桃分享到。
5G浪潮之下,数字化转型离不开强大的数据中心能力。而作为IT支撑系统的关键基础设施——数据中心网络,需要更高效,更敏捷地支撑业务变革。
数据中心迎来巨变,全以太释放更强能量
于此同时,包括通用计算资源、高性能计算资源和存储资源的数据中心基于架构、计算单元和存储介质正在发生天翻地覆的变化,一旦的对象和架构发生变化,网络就要做出相应调整。
比较明显的变化就是,数据中心节点百倍的增长,让IT架构从集中式走向分布式;计算单元性能百倍的提升,让PCIE总线优势不在;存储介质从机械硬盘向全闪存升级,性能也是百倍的提升。这些变化引领着服务器以太互联、CPU/GPU以太互联以及全闪存以太互联的进化。也就是说,架构、计算和存储的三大变革正驱动数据中心网络从原来的多协议模式向全以太化演进。
“IT架构从集中式走向分布式,大规模节点互联已成为以太网的天下;计算单元无论是CPU还是GPU都在去PCIE总线,突破总线的速率瓶颈,直接出以太口来提供更高算力;从存储介质上看,机械硬盘向全闪存升级,性能提升百倍,传统FC只有32G带宽,不满足全闪存高吞吐的需求,于是带宽高达400GE的以太网成为新一代存储网络的事实标准。” 华为数据中心网络领域总裁王雷解释到。
同时数据中心全以太数据中心网络全以太演进过程中还面临着众多挑战,包括高性能计算要求零丢包和存储双活要求的零丢包挑战,以及大规模网络运维更复杂的挑战。
从技术角度看,华为数据中心网络领域总裁王雷认为, “众所周知以太网天然是丢包的,自诞生以来40多年一直都没有解决,而随着网络规模的增加,丢包率将呈指数级增长;在存储同城双活场景中,由于长距传输带来的额外数百微秒的时延,让网络流控实现零丢包更是雪上加霜;以太网缺乏有效运维手段,而在云化趋势下,网络规模百倍增长,端口、策略等网络对象关系达到百万级,仅靠人工已无法进行网络运维。”
以变化应对变化,华为全新的CloudFabric 3.0联接加速数据中心融合
云南移动IT资源池的建设是一个长期的工程,需要攻克一个又一个难关,华为联合云南移动积极加速变革,基于四步走来对网络架构进行改造。
新建超大呈贡资源池
由于老网空间和供电等限制,云南移动在昆明呈贡规划了一个新的超大数据中心,规模满足未来十年的业务增长需求。
构建跨DC统一资源池
运用大二层 VxLAN 技术,云南移动把六个数据中心全部互联,形成了数据中心之间端到端的二层互通,为后面的业务灵活部署和迁移提供了物理基础。形成逻辑上的一个资源池。
业务分批部署、迁移
基础架构搭建好后,依照先对内支撑系统,后 业务支持系统的原则,依次对业务进行迁移,逐步把业务重心迁移到新的呈贡数据中心,部分业务留在老数据中心,实现了业务的平滑迁移。
形成一主多活多平面
“到今年底,按照我们规划,呈贡机房服务器规模将超过四千台。形成以呈贡数据中心为主数据中心,连接五大次规模数据中心的超大资源池格局。多数据中心之间形成主备出口,保证所有业务运行顺利,稳定性有极高保障。”于桃谈到。
华为提出要解决现有的数据中心网络面临的挑战,应当具备三大特征:网络实现无损全以太,实现计算和存储网络的融合,解决本地和长距传输下0丢包的问题;管理层实现部署全生命周期自动化,确保网络快速响应需求变化,业务快速上线;另外,还要实现全网的智能运维,确保业务0中断。
而华为推出全新的CloudFabric 3.0超融合数据中心网络方案,基于网络智能管控系统iMaster NCE、以及CloudEngine数据中心交换机两大部件实现了:
全以太HPC网络:攻克以太网丢包难题,100%释放算力;
双活全以太存储网络:突破长距以太无损,存储性能提升87%;
全生命周期自动化:实现网络即服务,业务秒级发放;
全网智能运维:实现故障自愈,保障业务7×24小时在线。
华为CloudFabric3.0助力云南移动构筑一朵云超能力
华为助力云南移动基于IT基础设施IaaS层打造的“全省一朵云”的战略,构建了超大资源池,通过CloudFabric 3.0超融合数据中心网络的智能化机制,实现了多数据中心资源通过跨数据中心大二层网络拉通,并遵循集团‘统筹规划、集中管理、资源共享、按需服务、弹性伸缩’‘五化’的战略。实现了一朵云融合多域,统一监控、运维、管理。
在超大规模资源池格局形成后,云南移动通过华为的iMaster NCE 控制器来纳管所有的数据中心网络,所有的租户资源的分配,业务的上下线,在一个控制平面就能完成。
在数据中心网络的接入层,部署了100GE超宽带宽的框式交换机,保证了流量突发时的带宽需求,为后期的增加大流量业务做好了准备。
同时将CloudFabric 3.0超融合数据中心网络的智能化机制引入了业务部署和网络运维,实现端到端智能化的业务部署,部署周期从天缩短到分钟级;针对网络故障,可以进行从感知到定位最后解决的5分钟闭环操作。
于桃谈到,基于华为CloudFabric3.0,云南移动网络数字化转型的效果实现了三升和三降。
三升:
业务部署效率提升
智能部署系统让网络开局效率提升了50%;
提升IT效能
SDN网络上层业务与底层设施解耦,业务的迁移变更用户没有任何感知,用户体验得到提升;
设备利用率提升
网络资源虚拟化,控制器统一分配,通过资源的池化实现设备的利用率上升。
三降:
TCO(总体成本)降低
资源池化和按需取用,实现TCO大幅降低;
风险降低
智能运维,业务状态和转发路径实时感知,实现网络健康度检查,故障快速处理,大幅降低业务系统风险,保障业务7×24小时在线;
用户投诉降低
新的SDN方案上线以来平稳无故障运行,实现网络0故障、0投诉的突破。
云南移动在基于新基建开展产品创新、服务创新和模式创新的过程中,华为CloudFabric数据中心网络方案为云南移动提供了强大的助力。未来展望,云南移动将携手华为,在自动驾驶网络(ADN)领域深化合作。在全生命周期自动化、全无损以太网以及全网智能运维领域深化合作,持续云网融合,加速智慧IT转型。
好文章,需要你的鼓励
Blackwell GPU的生产制造工作量达到Hopper GPU的两倍有余,但带来的收入仅增加至约1.7倍。
由AMD驱动的El Capitan超级计算机(现位于美国劳伦斯利弗莫尔国家实验室(LLNL))成为世界上速度最快的超级计算机。