|
3、故障原因
大家知道,DNS服務(wù)器用于將用戶域名轉(zhuǎn)換為IP地址,一般來說不會出現(xiàn)什么問題。但由于某些原因,造成了類似本例的中轉(zhuǎn)換地址統(tǒng)統(tǒng)指向了營業(yè)廳子網(wǎng)的業(yè)務(wù)服務(wù)器。業(yè)務(wù)服務(wù)器不具備路由處理功能,對發(fā)送來的IP數(shù)據(jù)包要么拒收并置之不理,要么返回目標(biāo)不可達(dá)或需要重定向的報告數(shù)據(jù)包。這就是我們在ICMP監(jiān)測時經(jīng)常觀察到的現(xiàn)象。
本地鐵通的用戶數(shù)量并不多,而且與上級網(wǎng)絡(luò)的鏈路帶寬為155M的ATM鏈路,大有富余,所以上Internet的用戶其上網(wǎng)速度主要受子網(wǎng)帶寬的影響。因為許多的用戶要經(jīng)過擁擠的無效E1鏈路,造成路由重定向和嚴(yán)重的時延。大量的IP數(shù)據(jù)包擁向只有2M帶寬的子網(wǎng)路由器,流量達(dá)到了97%,造成子網(wǎng)工作速度突然變慢,路由器出現(xiàn)嚴(yán)重?fù)砣痊F(xiàn)象。
4、兩點建議
(1).DNS服務(wù)器要定期“體檢”
基為了防止DNS服務(wù)不穩(wěn)定造成業(yè)務(wù)中斷或出錯,不少網(wǎng)管人員在設(shè)置DNS服務(wù)器時都安裝了備用DNS服務(wù)器,亦即安裝不只一臺DNS服務(wù)器。但這樣做也會帶來一個潛在的危險,即主DNS服務(wù)器出問題,備用自動服務(wù)器投入運行,這樣會犧牲一定的網(wǎng)絡(luò)帶寬,使得系統(tǒng)總體性能有所下降。危險在于,性能的下降常常是在不知不覺中來到的。所以,為了保證網(wǎng)絡(luò)經(jīng)常處于良好的工作狀態(tài),網(wǎng)絡(luò)管理人員需要定期檢查DNS服務(wù)器的轉(zhuǎn)換表。
本故障中的DNS指向錯誤導(dǎo)致用戶的IP數(shù)據(jù)包對準(zhǔn)了子網(wǎng)服務(wù)器,但如果對準(zhǔn)的不是服務(wù)器而是中心網(wǎng)絡(luò)本地網(wǎng)段中的某臺機器,則故障強度會減弱,用戶不會感到非常明顯的速度變慢。這樣可能不會感到明顯的“身體不適”從而使得網(wǎng)絡(luò)長期帶病運行。就象人一樣,定期的體檢對及時發(fā)現(xiàn)疾病及其隱患是非常必要的。而如何及時發(fā)現(xiàn)路由優(yōu)化方面的問題,也是網(wǎng)絡(luò)定期項目測試中的內(nèi)容之一,對大型網(wǎng)絡(luò)則更有必要,必須堅持定期維護(hù)和測試。
(2).網(wǎng)絡(luò)狀況的實時監(jiān)控
許多網(wǎng)絡(luò)設(shè)備如路由器、交換機、只能集線器等都支持SNMP網(wǎng)管功能,但為了全面監(jiān)測網(wǎng)絡(luò)通道功能,還需要網(wǎng)絡(luò)設(shè)備支持全面的RMON和RMON2。用這樣的設(shè)備組建起來的網(wǎng)絡(luò)其管理和故障診斷功能是很不錯的。但現(xiàn)實的問題是,這樣的網(wǎng)絡(luò)設(shè)備價格是普通網(wǎng)絡(luò)設(shè)備的6~10倍左右,用戶難以接受。因此,為了隨時監(jiān)測網(wǎng)絡(luò)的服務(wù)應(yīng)用流量及其比例、來源,工作記錄以及必要時進(jìn)行解包分析,建議用戶在重要的服務(wù)器通道或路由通道上安裝監(jiān)測接口。以便必要時可以隨時將流量分析儀、網(wǎng)絡(luò)測試儀接入通道進(jìn)行監(jiān)測和分析。這樣,本故障的查找時間可以縮短到20分鐘左右。當(dāng)然,如果資金允許,也可以將流量分析儀長期接入通道對多個重要的網(wǎng)絡(luò)設(shè)備進(jìn)行全速率透明流量監(jiān)測,這樣可以把故障定位時間縮短到1分鐘以內(nèi)。
這次“出診”總的來說還算順利,其實每次出診就是一次學(xué)習(xí)和提高的機會。也許上述案例只是個案,你可能不會遇到,但排錯思路還是值得大家借鑒的。另外,最后的兩點建議我希望能夠引起大家的重視。 |
【收藏】【打印】【進(jìn)入論壇】 |
|
|
|
|
|
|
|