随着云计算、虚拟化、SDN等技术在数据中心持续落地,数据中心网络到了不得不改变的时候了。为了满足这些新的技术需求,数据中心网络架构也从传统的三层网络向大二层网络架构转变,也就是新一代的数据中心将采用二层的网络架构,所有的接入设备都连接到核心网络设备上,然后通过核心设备路由转发出去。在数据中心内部完全是一个二层网络,而且为了实现跨数据中心的VM迁移,数据中心之间也可以跑二层,当前是虚拟的二层网络,基于物理三层网络来跑二层。数据中心内部网络架构向大二层转变的趋势已经无法更改,将会有越来越多的数据中心网络架构向这个方向发展。数据中心内部网络建设成为一个大的二层网络,虽然架构上清晰了,简单了,但是却带来不少的现实难题。下面就来说一说,新一代数据中心网络架构变革所遇到的难题。

大二层MAC容量问题

数据中心网络架构向着大二层方向演变,首先带来的就是MAC容量的难题。二层网络根据MAC地址来完成点到点的转发,在数据中心里拥有数千台服务器是再普通不过的了,而如今跨数据中心之间也要实现二层转发,这样就要求数据中心的核心设备MAC容量超大才行。比如一个中等城市宽带网络至少要拥有100万个家庭,要实现所有的家庭宽带上网,若都采用二层的数据中心网络,则需要核心网络设备可以处理1M的MAC容量,这对网络设备提出了很高的要求。目前能够达到1M的MAC容量的网络设备的确有,但是应用并不普遍,32K~256K是最常用的容量规格。采用1M的MAC容量设备,这样的设备往往价格很高,会给数据中心带来沉重的负担,而且这样大规格的设备使用并不普及,设备的稳定性低。很多能够达到1M的MAC容量的设备采用的都是芯片外挂TCAM来实现的,这种方式由于是通过PCI总线来访问外挂器件,访问速度自然没有芯片内快,所以这种方式的MAC学习速度并不是线速的。在一些网络环路、震荡中,这些设备就会表现出MAC学习不稳定,流量有丢包,显示有问题等一系列待解决的问题。所以在大二层的数据中心网络中,如何提升网络设备的MAC容量,是当前网络技术中急需解决的问题。如今通过技术手段达到1M以上MAC容量并不是难事,但在这种网络环境下,要保证网络运行的稳定性,还有很多的技术难题要解决。

环路问题

二层网络最常见的网络故障就是环路问题,在网络规模比较小的情况下,可以通过部署STP/MSTP这些环路协议避免环路的产生。当然STP/MSTP协议有天生的缺陷,阻塞了备用链路,造成网络带宽的严重浪费,后来又出现了TRILL新的二层网络环路协议。TRILL协议可以保证所有的链路都处于转发状态,避免了网络带宽的浪费。不过我们知道TRILL实际上要靠ISIS协议来维持TRILL协议的状态,当网络规模很大的时候,网络设备要处理大量的ISIS协议,这对网络设备是一个不小的冲击。能够拥有1M的MAC容量的网络设备,端口数量要数百个,要保证所有这些的端口的TRILL状态计算准备,并且在有网络震荡的情况下,TRILL协议仍能正确切换,这对网络设备要求很高,尤其要保证 TRILL协议的切换速度。比如像STP协议,在正常切换的情况下,速度都要30秒,而若网络规模比较大,则所花费的时间会更长,达到分钟级别都是有可能的。TRILL协议也是如此,ISIS协议并不是快速收敛的协议,超时时间,切换速度都不比STP协议快,所以在TRILL的二层环路网络中,一旦发生网络切换,那么收敛速度是个问题。数据中心很多业务是非常敏感的,在网络出现丢包或者震荡数秒钟,都会影响到业务,所以当数据中心二层网络规模扩大以后,环路协议的收敛问题突显。有人建议将TRILL的ISIS协议处理提升优先级,比如放到一个单核上处理,通过软件中断的方式处理响应,这样能够大大提升切换的速度,避免受到其它协议的影响,当然这样自然会占用更多的设备资源,而且效果也未知。

广播域过大的问题

大二层还会遇到一个问题就是广播域过大。因为整个数据中心,甚至多个数据中心之间都是二层的,那么一个广播报文会在整个数据中心的设备上进行广播的,显然会占用大量的网络带宽,如果广播流量比较多,可能会造成个别的端口出现拥塞,从而影响业务。在正常的网络中,肯定是广播流量越小越好。对于大二层网络广播域过大的问题,还好有一些解决的方法,而且这些方法目前看是比较符合实际的。比如:默认情况下,禁止广播报文的转发,让广播报文和组播报文一样,通过协议控制转发,只有协议状态计算好之后,才允许广播报文转发,而且是像组播一样,只转发给请求接收的端口,也就是在未来的数据中心里将没有广播的概念,只有单播和组播的概念。对于跨数据中心的二层,这种二层转发实际上是一种逻辑上的二层转发,要通过物理三层转发,是一种封装技术,这样就可以通过软件控制这种情况下,广播报文要不要转发。在默认情况下,跨数据中心的二层广播报文是不转发的,可以通过软件设置让特定的广播报文转发。还有就是对广播报文设置广播抑制比,当端口上的广播流量达到一定比例时,对广播报文进行丢弃。显然,对于大二层广播域过大的问题,目前已经有了一些比较好的解决方法,可以很好地解决这一问题。

尽管数据中心网络架构的演变面临着各种各样的问题,但是向大二层转变的趋势已经无法改变。纵然这样的架构给数据中心带来了新的问题,但是正是有了这些缺陷,也给了网络设备商机会,谁能很好地解决这些问题,谁就能在未来的网络市场上战胜对手,赢得市场。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2019-07-17 10:01:54
国际资讯 阿姆斯特丹暂停数据中心投资热潮
荷兰首都阿姆斯特丹以诱人的税收和相对便宜的电力吸引了科技公司,但目前正在暂停在今年年底之前建立更多数据中心,据称这些数据中心的开放速度给荷兰房地产市场和电力网络 <详情>
2019-07-16 21:30:44
数据中心液冷 曙光何继盛:全浸没式液冷将成为趋势
随着IT技术和互联网需求的暴增,从2010年开始,我国正式进入了超大规模数据中心(超算)时代。同时,几千至上万机架的数据中心开始出现。 <详情>
2019-07-16 14:31:47
区块链 比特大陆对“美国德州数据中心项目搁浅”报道做出回应:传言不实,该项目正常运行中
有关人士据此前媒体曾报道关于”比特大陆美国德州全球最大数据中心计划搁浅“一事向比特大陆方面负责人求证,比特大陆方面回应称:此为不实报道,该项目目前在正常运行中。 <详情>
2019-07-16 10:03:01
机房建设 数据中心托管业务或将与云计算分庭抗礼
与构建自有数据中心相比,更低的价格和延迟,以及对多个云计算提供商的轻松访问,使托管数据中心设施成为一个对企业更具吸引力的选择。 <详情>
2019-07-16 09:35:50
数据中心液冷 PUE成明确限制 这三因素能否驱动液冷在数据中心崛起
数据中心的PUE值成为政府、企业共同的关注点,液冷技术凭借散热优势成为数据中心降低该指标的新方法。除PUE指标外,还有三个因素驱动着液冷技术在数据中心崛起,分别为AI、 <详情>