排除路由器網(wǎng)絡故障
隨著Internet的高速發(fā)展,局域網(wǎng)絡技術(shù)在企業(yè)、研究部門生產(chǎn)、管理、科研中得到廣泛的應用。局域網(wǎng)上連往往要配置管理核心路由器和核心交換機,從而實現(xiàn)上連廣域網(wǎng)和Internet。核心路由器狀態(tài)的好壞直接影響整個局域網(wǎng)的性能。本文通過運用嗅探技術(shù)和路由管理技術(shù)完成了對核心設備網(wǎng)絡故障排除的成功事例。
排除路由器網(wǎng)絡故障的方法
下面以某研究院為例
在一個研究院工作,研究院局域網(wǎng)骨干網(wǎng)采用ATM技術(shù)搭建,核心交換機為Fore7110并且有路由功能,通過以太網(wǎng)仿真ELAN技術(shù),下連3臺Fore7105構(gòu)成研究院ATM骨干網(wǎng),上連企業(yè)ATM網(wǎng)。網(wǎng)絡拓撲為星型樹結(jié)構(gòu)。擁有10.65.100.0—10.65.111.0九個子網(wǎng)段,共2300個IP地址資源,足以滿足我院 1248臺PC電腦、138臺工作站和網(wǎng)絡交換設備對節(jié)點的需求。
研究院局域網(wǎng)光纖線路覆蓋大小建筑34幢,共有信息點1150個。在Internet服務方面有域名服務系統(tǒng)、電子郵件系統(tǒng)和Web站點。
故障的出現(xiàn)
我院的Fore7100是支持最大交換1.6G帶寬的具有路由功能的核心交換設備,一天,該交換機出現(xiàn)如下現(xiàn)象:
工作狀態(tài)指示異常繁忙,交換速度極慢,又沒有其它特征。網(wǎng)絡連通測試(ping)是通的。單響應時間慢到300ns-900ns不等。Fore7010交換機的路由包監(jiān)測發(fā)現(xiàn)無效路由包在極短的時間內(nèi)增長很快,數(shù)量級為105~106甚至107。僅僅在10秒種內(nèi),有效的路由服務就癱瘓了,形成了網(wǎng)絡安全上稱為拒絕服務的攻擊。
我們直接進入到 Fore7110交換機 ( 10.60.11.62),用stats命令顯示路由記錄信息。
Telnet 10.60.11.62
PB1_JSZ3:ip# stats -P IP(當前路由記錄信息)
IP statistics: count since last stats clear
Datagrams forwarded: 170073
Datagrams rcvd: 175164
……
No route to send: 5507
……
(交換機無法發(fā)送的無效路由請求數(shù))
經(jīng)過查看顯示的路由記錄信息,發(fā)現(xiàn)8.3,8.5,8.6端口無效路由包請求增長很快。
檢測過程
我們決定對Fore7110顯示的幾個無效路由包增加過快的幾個端口進行監(jiān)測。在沒有相應的網(wǎng)絡性能分析儀(Sniffer網(wǎng)絡分析儀)的情況下,我們決定通過修改Fore的VLAN將需要監(jiān)測的8.3、8.5、8.6等端口與具有snoop功能的Sun工作站jsz3上連口8.1劃分到同一VLAN中。同時通過Fore7110 監(jiān)控Monitor端口命令。需要注意:使用monitor 命令對交換設備有較大的性能的影響。
步驟1: 登錄核心交換機
Telnet 10.60.11.62
PB1_JSZ3:ip#mediaPB1_JSZ3:media# segment pdisable 8.3,8.5,8.6PB1_JSZ3:media#
monitor set 8.3 to 8.6 on 8.1
執(zhí)行jsz3的solaris系統(tǒng)的Snoop命令,進一步對1.1、8.3、8.5、8.6幾個端口packet進行監(jiān)視,發(fā)現(xiàn)IP地址分屬于8.3、8.6端口的10.60.12.17、10.60.12.59、10.60.10.57的機器發(fā)送大量的路由包,8.5端口正常。確定了機器IP后我們自然想到為什么會有大量的路由請求呢?。以Sun工作站(10.60.10.57)為例。通過遠程登錄該機器。我們執(zhí)行solaris系統(tǒng)的Snoop命令。
步驟2:遠程登錄
#Telnet 10.60.10.57#Snoop
該機器發(fā)送的以“ 0.22.*.*” 為IP地址的無效路由請求數(shù)量很大。
步驟3:在這臺機器上顯示進程
#ps-eaf more
發(fā)現(xiàn)/Dev/cuc目錄下的可疑執(zhí)行文件chinaworm.exe及相關(guān)tar文件,并證明該文件為病毒。這就是故障的原因。
解決的方法
刪掉該文件,關(guān)閉相關(guān)的遠程網(wǎng)絡服務。機器和交換機、網(wǎng)絡都恢復了正常。通過Sun上執(zhí)行#snoop命令可以顯示無效路由包數(shù)量的增加降為101-102數(shù)量級。歸于正常的增長范圍。
在這次排除故障的工作中,我們運用現(xiàn)有的網(wǎng)絡環(huán)境和可以實現(xiàn)的手段,通過對核心交換機路由狀態(tài)各類參數(shù)的實時分析、判定路由器狀態(tài),通過對Fore7110 Vlan調(diào)整、monitor端口監(jiān)測,利用嗅探器技術(shù)在SolarisOS應用(Snoop命令),確定了導致大量無效路由發(fā)生的事實,成功的解決了影響網(wǎng)絡性能的網(wǎng)絡隱患。這對在Unix系統(tǒng)中排查蠕蟲病毒,維護網(wǎng)絡的正常運行都有很好的借鑒意義。
排除路由器網(wǎng)絡故障的相關(guān)文章: