相信大家都聽(tīng)過(guò)網(wǎng)絡(luò)環(huán)路這個(gè)詞吧,網(wǎng)絡(luò)環(huán)路會(huì)對(duì)企業(yè)網(wǎng)絡(luò)存在很大的威脅,它會(huì)造成網(wǎng)絡(luò)里的廣播風(fēng)暴,耗盡交換資源,造成交換機(jī)癱瘓,最終導(dǎo)致的就是直接的經(jīng)濟(jì)損失。今天我們就來(lái)聊聊,環(huán)路的產(chǎn)生、排查、解決以及如何防范。
一、什么是環(huán)路
以太網(wǎng)交換網(wǎng)絡(luò)中為了提高網(wǎng)絡(luò)可靠性,通常會(huì)采用冗余設(shè)備和冗余鏈路,然而現(xiàn)網(wǎng)中由于組網(wǎng)調(diào)整、配置修改、升級(jí)割接等原因,經(jīng)常會(huì)造成數(shù)據(jù)或協(xié)議報(bào)文環(huán)形轉(zhuǎn)發(fā),不可避免的形成環(huán)路。如圖所示,三臺(tái)設(shè)備兩兩相連就會(huì)形成環(huán)路。當(dāng)設(shè)備未部署環(huán)路保護(hù)協(xié)議或者組網(wǎng)配置發(fā)生變更時(shí),環(huán)形組網(wǎng)中就可能會(huì)產(chǎn)生廣播風(fēng)暴。
二、環(huán)路的危害
二層環(huán)路最大的危害就是會(huì)產(chǎn)生廣播風(fēng)暴,以太網(wǎng)是一個(gè)支持廣播的網(wǎng)絡(luò),在沒(méi)有環(huán)路的環(huán)境中,廣播包在網(wǎng)絡(luò)中以泛洪的形式被送達(dá)到網(wǎng)絡(luò)的每一個(gè)角落,以保證每個(gè)設(shè)備都能夠接受到它。在帶寬允許的情況下,每個(gè)網(wǎng)橋在接收到廣播報(bào)文以后,都會(huì)向除接收端口以外的其他所有接口轉(zhuǎn)發(fā)這個(gè)廣播包,一旦網(wǎng)絡(luò)中有環(huán)路,這種簡(jiǎn)單的廣播機(jī)制就會(huì)引發(fā)災(zāi)難性后果。
環(huán)路中一個(gè)廣播報(bào)文被反復(fù)轉(zhuǎn)發(fā)了千萬(wàn)次,產(chǎn)生了廣播風(fēng)暴并且很快達(dá)到或接近端口線(xiàn)速,并迅速消耗鏈路帶寬。根據(jù)轉(zhuǎn)發(fā)規(guī)則,這些廣播報(bào)文不僅僅只是在環(huán)路上無(wú)限轉(zhuǎn)發(fā),環(huán)路設(shè)備還會(huì)向其他端口轉(zhuǎn)發(fā)一份,這樣整個(gè)網(wǎng)絡(luò)中都充斥著大量重復(fù)廣播報(bào)文。
二層網(wǎng)絡(luò)設(shè)備處于同一個(gè)廣播域下,廣播報(bào)文在環(huán)路中會(huì)反復(fù)持續(xù)傳送,無(wú)限循環(huán),形成廣播風(fēng)暴,引發(fā)MAC地址表不穩(wěn)定等現(xiàn)象描述,進(jìn)而影響正常業(yè)務(wù),導(dǎo)致用戶(hù)通信質(zhì)量較差,甚至通信中斷。
三、如何判斷環(huán)路故障
所有這些誘發(fā)故障的內(nèi)在因素絕大多數(shù)都有其“外在異常表現(xiàn)”,具體會(huì)反映在特定網(wǎng)元的告警、日志、流量統(tǒng)計(jì)、端口狀態(tài)等信息中。因此故障快速定位的關(guān)鍵在于,如何有效而快速的通過(guò)事發(fā)時(shí)間、影響范圍、所做操作及故障網(wǎng)絡(luò)范圍的網(wǎng)元基本信息的查看,快速發(fā)現(xiàn)這些“外在異常表現(xiàn)”所在的點(diǎn),進(jìn)而鎖定故障網(wǎng)元節(jié)點(diǎn),找出原因分析。
四、環(huán)路故障診斷步驟
判斷網(wǎng)絡(luò)中是否存在二層環(huán)路,一般可以使用查看接口帶寬流量、查看MAC漂移告警、部署環(huán)路檢測(cè)、查看CPU占用率四種方法進(jìn)行確認(rèn)。這四種方法沒(méi)有嚴(yán)格的操作順序,為更加準(zhǔn)確判斷故障屬性,可以使用其中的一種或多種方法來(lái)進(jìn)行問(wèn)題定位。
五、如何快速破環(huán)
以太網(wǎng)環(huán)路會(huì)在短時(shí)間內(nèi)形成數(shù)據(jù)風(fēng)暴,當(dāng)端口的流量達(dá)到帶寬的最大負(fù)荷,會(huì)形成鏈路擁塞,影響網(wǎng)絡(luò)業(yè)務(wù)。因此,在確認(rèn)現(xiàn)網(wǎng)存在數(shù)據(jù)環(huán)路后,需要第一時(shí)間按照如下步驟處理,盡快恢復(fù)數(shù)據(jù)業(yè)務(wù)。
梳理網(wǎng)絡(luò)拓?fù)洳⒆R(shí)別環(huán)路
環(huán)形網(wǎng)絡(luò)拓?fù)湟话爿^為復(fù)雜,可以尋求到網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)全圖,具體到網(wǎng)絡(luò)的VLAN規(guī)劃信息,每臺(tái)設(shè)備名稱(chēng)、系統(tǒng)MAC、管理IP,本端端口名稱(chēng)、對(duì)端端口名稱(chēng)。
完整的拓?fù)湫畔⑹墙鉀Q環(huán)路問(wèn)題的首要條件,如果沒(méi)有拓?fù)鋱D,需要從發(fā)現(xiàn)環(huán)路的設(shè)備,通過(guò)逐跳登錄,記錄設(shè)備信息、端口信息和VLAN信息,手動(dòng)繪制完整的拓?fù)洹?/p>
緊急破環(huán)
緊急破環(huán)又稱(chēng)手動(dòng)破環(huán),當(dāng)網(wǎng)絡(luò)風(fēng)暴嚴(yán)重影響正常的業(yè)務(wù)時(shí),需要使用此方法盡快恢復(fù)業(yè)務(wù)。
端口退出已成環(huán)的VLAN
在已經(jīng)成環(huán)的網(wǎng)絡(luò)上,將其中一個(gè)端口退出成環(huán)VLAN,屬于影響面最小的破環(huán)方法。
shutdown已經(jīng)成環(huán)的端口
shutdown已經(jīng)成環(huán)的物理端口,也可以達(dá)到破環(huán)的效果。需要注意的是執(zhí)行此動(dòng)作之前,您需要確保在接口視圖下執(zhí)行命令shutdown關(guān)閉接口后,不會(huì)影響正常的數(shù)據(jù)業(yè)務(wù)。
拔出成環(huán)接口破環(huán)
通過(guò)拔出成環(huán)的端口的連接光纖或網(wǎng)線(xiàn),也可以緊急破環(huán)。該方法可以使用Shutdown端口代替,在設(shè)備無(wú)法遠(yuǎn)程登錄時(shí)可以使用。
確認(rèn)業(yè)務(wù)已經(jīng)恢復(fù)
通過(guò)Ping等操作測(cè)證網(wǎng)絡(luò)通信質(zhì)量,并觀察現(xiàn)網(wǎng)業(yè)務(wù)是否已經(jīng)恢復(fù)。環(huán)路拓?fù)浯嬖谌哂噫溌泛团渲茫虼谁h(huán)路破除后業(yè)務(wù)一般會(huì)自行恢復(fù)。
六、網(wǎng)絡(luò)加固和優(yōu)化
部署適當(dāng)?shù)钠茐膮f(xié)議
如果當(dāng)前的環(huán)路問(wèn)題是由于物理環(huán)路引入,按照網(wǎng)絡(luò)規(guī)劃合理部署破環(huán)協(xié)議。以太網(wǎng)交換機(jī)常見(jiàn)的破環(huán)協(xié)議為STP/RSTP/MSTP/VBST、RRPP、SEP、ERPS等。
部署廣播抑制提升網(wǎng)絡(luò)健壯性
為了避免再次成環(huán),成環(huán)后再次引入數(shù)據(jù)風(fēng)暴,建議在環(huán)上設(shè)備端口下,部署廣播抑制,按照經(jīng)驗(yàn),部署5%的廣播抑制可以很好的防止廣播風(fēng)暴,具體抑制的比例值可以按照現(xiàn)網(wǎng)并發(fā)廣播流量來(lái)評(píng)估確認(rèn)。
優(yōu)化網(wǎng)絡(luò)設(shè)計(jì),提升網(wǎng)絡(luò)
復(fù)雜組網(wǎng)可以通過(guò)分層控制,建議合理規(guī)劃設(shè)計(jì)接入層、匯聚層,通過(guò)堆疊、集群等橫向虛擬化技術(shù)簡(jiǎn)化網(wǎng)絡(luò)架構(gòu)。單層組網(wǎng)內(nèi)設(shè)備數(shù)量較多時(shí),建議按照邏輯組織和地理分布,劃分不同的域。