李云峰指出,数据中心网络近些年最大的革新莫过于软件界说网络的诞生,在李云峰看来,经过使操控面与数据面分离
李云峰:谁在推进网络智能化的演进加快?
李云峰指出,数据中心网络近些年最大的革新莫过于软件界说网络的诞生,在李云峰看来,经过使操控面与数据面分离,让网络具有了更高的敏捷性、可扩展性和可编程才能,在大幅提高网络自动化水平的一起,有用降低了用户在网络布置和运维方面的压力。
正因为此,短短几年,SDN就获得了广泛的使用,成为企业级用户布置和装备网络服务的重要选择。
不过,好景不长。跟着用户事务与网络服务绑定的更为紧密,企业级网络使用规模的不断扩展,特别是在大规模云数据中心这种复杂度高、调整频频的使用场景中,即使具有自动化辅助手法,用户的运维和本钱压力仍旧很难真正缓解。
以企业园区为例,网络服务不仅要满足日常工作使用,还需为生产制作、移动工作、视频会议等不同使用、不同质量要求的场景供给支撑,这意味着网络要像服务器、存储一样随时满足事务需求的忽然改变,峰值要增加资源,谷底要削减。显着,仅自动化是不行的,网络需求更智能化。
为了满足用户的实践需求,新华三于2019年推出了更具智能化特点的先知网络架构,并以此为根底开发数据中心网络产品解决计划。短短一年间,该技能已在很多用户布置使用,反响热烈。以山东大学为例,经过布置SNA计划,问题定位从小时级提至分钟级,网络保护工作量削减了80%。
本年,新华三对SNA再次进行了升级,嵌入了智能剖析器和智能操控技能,也便是说网络智能化程度再获提高。
SNA的原理是什么?
简略来说,SNA的中心在于可以经过“感知-剖析-决策”模式,将丰厚的网络运维数据经过人工智能的练习和推理进程,转化为更优的网络战略,然后帮助最终用户有用提高网络智能剖析和事务编列才能,降低本钱。
具体来说,SNA架构如图一所示,其由先知服务中心、先知剖析器以及网络操控器三大模块组成。
其间,先知服务中心作为网络智能办理、操控和编列的中心,不仅可依据用户的事务需求完成智能编列、事务协同和资源调度,更能汇总各个网络设备的数据,在其内部AI渠道中进行建模、评估、练习和调优,并构成一系列智能网络模型供调用。
假如把先知服务中心比作SNA的“大脑”,那么先知剖析器和网络操控器便是SNA的“手和眼”。经过Telemetry等毫秒级收集技能,先知剖析器可从网络根底架构中感知和收集各类数据,并经清洗、抽取、转换等处理进程,上传到先知服务中心中。
经过先知服务中心练习和调优的模型,在云端或先知剖析器中进行AI推理后,可构成有用的自动化网络布置和调优战略。而网络操控器则会依据这些战略,以可编程的办法对网络根底架构实施办理,包含完成事务的自动化布置,网络资源的最优路径调度,以及网络毛病的猜测告警和快速排除等。
大脑、手、眼协同配合,让网络变得更智能。现在,SNA现已能为用户供给20余种智能网络算法以及100多种网络状态洞悉办法。
才智背后的强力支撑
讲到这里,必须提到为SNA供给强壮算力支持及多种练习模型优化计划的英特尔。众所周知,由交换机、路由器、无线AP等各类根底设备构成的网络中,各种事务日志、易损件状态、异常告警等信息是巨量的,假如不能有用的处理,这些数据基本等同于没用,而处理这些数据需求强壮的算力。
正如新华三AI研究院院长敖襄桥所说,“SNA经过AI技能实时感知网络状态,根据网络数据剖析完成自动化布置和危险猜测,然后让网络能更智能、更高效地为最终用户事务供给支撑。经过引进第二代英特尔至强可扩展处理器以及面向英特尔架构优化的TensorFlow,SNA的AI练习才能获得了大幅提高,让企业网络在应对复杂事务场景时愈加挥洒自如。”
究竟提高有多么显着?新华三联合英特尔进行了一系列面向实践使用场景的测验。下面就以DNS地道检测模型为例,展现一下提高后的作用。
作为网络使用中重要的根底协议之一,恶意程序经常会使用域名体系恳求时构成的DNS地道来对网络实施攻击,例如将数据封装在DNS恳求数据包中,然后绕开内外网阻隔等防护办法,形成企业内网的要害信息被透传。
由于这类恶意攻击躲藏到了DNS地道中,因而,惯例的网络安全检测办法,例如特征码检测、流量监测、要挟标志检测等都难以对其发挥作用。针对此,新华三以海量DNS恳求报文为根底,在SNA Service Center中构建根据长短期记忆网络的DNS地道检测模型,来帮助用户提高网络安全等级。
作为递归神经网络的重要衍生模型,LSTM可以经过3个特别的“门”结构设计,来大幅提高模型的记忆时长,因而特别适用于DNS恳求这类典型的时序性数据。其可以环绕一段时间内的黑白名单数据集中正常和恶意恳求的不同特征,例如主机名、DNS名称、特定字符等,来猜测新的恳求中可能面临的安全危险。
显而易见,更长的时序特征提取、更复杂的门结构,意味着模型在练习和推理中需求更多的核算量。为此,新华三引进第二代英特尔至强可扩展处理器和面向英特尔架构优化的TensorFlow。
比照测验中,两组测验的硬件装备相同,但基准组搭配的是原生TensorFlow,比照组搭配的则是面向英特尔架构优化的TensorFlow。验证测验的黑白名单数据集包含了20000条黑名单样本和30000条白名单样本,并以10000条数据作为测验集。同一硬件渠道,经过优化后,练习功能可提高到基准值的3.2倍。
不止于网络,一切智能化
其实,不仅仅是网络,伴随智能化浪潮来袭,更多企业级ICT设备都执政智能化方向展开,特别是布置在大型云数据中心内,在运维和办理上相同需求AI助力的设备。
以服务器为例,早在多年前其运维就开端导入可感知其运转状态(包含使用率、耗电量、散热情况以及毛病反应)的遥测技能,以及与之相匹配的“监控-学习-行动-决议“办理机制,而跟着AI的一系列使用优势,包含可使用数据练习更好用和实用的办理和战略模型,并在无需或较少人工介入的情况下及时且并发呼应不同事件,有的放矢地实施战略等才能在这些设备办理和运维进程中越来越凸显其重要性,将AI办法引进这些ICT设备的办理和运维也成为大势所趋。
实践上,继SNA后,新华三现已开端携手英特尔展开服务器办理方面的智能化探究。
在实践的比对测验中,相同硬件装备下,使用第二代英特尔至强可扩展处理器与面向英特尔架构优化的TensorFlow组合,模型的推理功能可提高至基准值的2.71倍;而在进一步导入并行多实例优化后,模型的推理功能还能在不影响延时的情况下,进一步提高到基准值的10.98倍。