近日,华为超融合数据中心网络智能无损技术论文ACC: Automatic ECN Tuning for High-Speed Datacenter Networks(高性能数据中心网络中的ECN动态调优)入选ACM SIGCOMM 2021,表明超融合数据中心网络的智能无损技术得到业内专家的一致认可,具有世界级技术影响力。该论文由华为与南京大学联合实现。
SIGCOMM是美国计算机协会在通信网络领域的旗舰型会议,也是目前国际通信网络领域的顶尖会议。SIGCOMM对论文的质量和数量要求极高,质量方面要求具有基础性贡献、领导性影响和坚实系统背景。SIGCOMM录用的论文大多数会被广泛引用,具有非常大的影响力。
本次入选的ACC(Automatic ECN)技术是华为全无损以太网络智能无损技术的代表。当今,随着AI和云业务发展,数据中心承载着诸多需要高带宽和低延迟的应用,包括大数据处理、分布式存储和高性能计算。而在已经广泛部署的拥塞控制方案中,显示拥塞通知(ECN: Explicit Congestion Notification)在保障网络和业务高带宽低时延中起到关键作用。但是传统的静态ECN参数配置,无法自适应数字时代种类繁多的动态业务流量模型。
例如,在不同厂商交换机、网卡等组成大型异构数据中心网络中,协同联调静态ECN参数变得非常困难;尤其在云多租户网络中,存在不同时空流量模型,导致网络工作负载动态变化,需要不同时间点适配ECN参数,事先配置的ECN参数则无法满足动态业务流量的性能需求。因此,在大规模高速组网和多租户业务流量等复杂场景下,人工调整全网适配ECN参数成为巨大挑战。
基于此,华为联合南京大学设计和实现ACC。ACC通过在超高速数据中心交换机中首次成功应用深度强化学习(DRL:Deep Reinforcement Learning)技术,自适应流量模型来动态调整ECN参数,从而简化网络运营,实现网络高利用率和低延迟。同时, ACC设计分布式多智能体技术实现大规模组网下可扩展性、基于商用交换芯片Telemetry能力实现快速可部署性、结合在线和离线训练方式提高场景的可泛化性,从而最终达到大规模高速网络的高吞吐和低时延性能目标,并且从业务层面保障应用性能表现最优。
在ACC理论研究基础上,华为推出了超融合数据中心网络CloudFabric 3.0解决方案,保障网络高吞吐低时延,100%释放算力。
华为超融合数据中心网络CloudFabric 3.0解决方案基于全以太架构构建0丢包的计算和存储网络,助力算力100%释放。该方案打破通用计算、存储、高性能计算三套网络架构的限制,统一使用以太网架构实现流量承载融合。该方案在业界率先实现L3自动驾驶网络能力、全生命周期自动化与全网智能运维,OPEX降低30%,使能企业智能化升级。
南京大学和华为是校企合作的成功典范之一。早在1993年,华为就在南大设立奖学金、奖教金;从1998年开始,接连举办5届“华为杯”南京大学学生科技创新竞赛。
近几年,华为与南大互动合作更加频繁,双方共建多家校企联合实验室,其中专项联合实验室研究方向涵盖了人工智能、软件工程、声学技术、超构材料、半导体显示等领域。2018年,华为在南大设立“紫金学者”人才基金,助力南大引进并培育信息与通讯技术领域的高层次人才。今年1月,南京大学与华为签约共建“智能基座”产教融合协同育人基地,双方将共同致力于培养未来行业ICT转型核心技术突破的国际开放型优秀人才。
此外,华为也是南大毕业生最向往的企业之一,每年都有一批毕业生加入华为,默默坚守岗位,为科技自立奉献青春之力。
2020年7月31日下午,华为技术有限公司CEO任正非带队访问了南京大学。任正非表示,南京大学作为一所著名高等学府,积极面向国家需求和国际前沿,很多科技成果处于世界领先水平,为国家发展做出了积极贡献,希望华为与南大有更深入的合作和交流,共同发现创新机遇,希望大学像“灯塔”,点亮教育之路,不拘一格培养创新人才。
南大与华为多年情谊不断延续和深化,双方积极探索了校企合作的新模式和新机制。希望南大与华为未来能进一步深化人才合作、提升科技合作水平、促进校企文化融通,为中国校企合作提供“新样板”,为信息与通信产业的发展乃至创新型国家建设做出新的更大贡献!