筆者辦公室使用的一臺(tái)普通二層交換機(jī),一直為我們默默服務(wù)了好幾年,到目前為止從來(lái)沒(méi)有出現(xiàn)什么意外,
網(wǎng)管故障實(shí)戰(zhàn):交換機(jī)癱瘓禍起自身免疫力
?墒,最近筆者單位局域網(wǎng)機(jī)房中有一臺(tái)交換機(jī)突然發(fā)生了奇怪的現(xiàn)象;考慮到故障現(xiàn)象的特殊性,筆者采用了特殊的方法進(jìn)行了排除,現(xiàn)在把具體的故障排除過(guò)程列寫(xiě)出來(lái),希望下面的內(nèi)容能給各位網(wǎng)絡(luò)管理人員帶來(lái)啟發(fā)!故障回放
筆者單位的局域網(wǎng)規(guī)模中等,局域網(wǎng)內(nèi)共有36臺(tái)普通工作站,4臺(tái)服務(wù)器,通過(guò)3臺(tái)交換機(jī)連接在一起,組成一個(gè)中等規(guī)模的局域網(wǎng)網(wǎng)絡(luò)。3臺(tái)交換機(jī)中有一臺(tái)使用的是CISCO品牌的24口100M交換機(jī),該交換機(jī)作為局域網(wǎng)中的主交換機(jī),4臺(tái)服務(wù)器以及另外兩臺(tái)交換機(jī)均直接連接到主交換機(jī)對(duì)應(yīng)的RJ45端口中;另外兩臺(tái)交換機(jī)使用的都是實(shí)達(dá)品牌的24口10M/100M自適應(yīng)網(wǎng)絡(luò)交換機(jī),這兩臺(tái)交換機(jī)分別作為次交換機(jī),用來(lái)連接普通的36臺(tái)工作站。局域網(wǎng)中的所有工作站都通過(guò)主交換機(jī),實(shí)現(xiàn)了與Internet網(wǎng)絡(luò)的互聯(lián)。
很長(zhǎng)一段時(shí)間,局域網(wǎng)中的交換機(jī)一直恪盡職守,維系著網(wǎng)絡(luò)的正常運(yùn)行?勺罱粌商,有幾個(gè)同事同時(shí)向筆者反應(yīng),他們的工作站不能正常上網(wǎng)了;起初,筆者還以為是同事操作不當(dāng)引起了網(wǎng)絡(luò)故障,于是趕到出現(xiàn)故障的工作站旁,嘗試進(jìn)行Internet網(wǎng)絡(luò)訪問(wèn)操作,事實(shí)驗(yàn)證了局域網(wǎng)網(wǎng)絡(luò)的確出現(xiàn)了問(wèn)題?墒,當(dāng)筆者對(duì)這臺(tái)不能上網(wǎng)的工作站進(jìn)行全方位檢查后,發(fā)現(xiàn)該工作站的網(wǎng)絡(luò)連接參數(shù)、接口的連接牢靠性等都沒(méi)有任何問(wèn)題;更為奇怪的是,局域網(wǎng)中并不是所有的工作站都不能上網(wǎng),還有多臺(tái)工作站不但上網(wǎng)正常,而且上網(wǎng)的速度也比較快。仔細(xì)對(duì)比上網(wǎng)正常工作站的網(wǎng)絡(luò)配置與不正常工作站的網(wǎng)絡(luò)配置后,筆者并沒(méi)有找到任何不同的地方,那為什么上網(wǎng)配置完全相同,但網(wǎng)絡(luò)連接結(jié)果卻不一樣呢?
會(huì)不會(huì)是交換機(jī)那邊有的網(wǎng)絡(luò)連接接口出現(xiàn)了松動(dòng)呢?筆者不放心這一點(diǎn),于是來(lái)到局域網(wǎng)機(jī)房的交換機(jī)旁,想檢查一下線纜接頭的連接情況;可誰(shuí)曾想到其中有一臺(tái)次交換機(jī)前端面板中的所有信號(hào)燈全處于長(zhǎng)亮不閃爍狀態(tài),很顯然該交換機(jī)的運(yùn)行狀態(tài)不正常,那么連接到該交換機(jī)中的所有工作站自然就不能進(jìn)行網(wǎng)絡(luò)訪問(wèn)操作了。再看看另外兩臺(tái)交換機(jī)時(shí),筆者發(fā)現(xiàn)它們的工作狀態(tài)都很正常,這也難怪局域網(wǎng)中有的工作站可以上網(wǎng),有的工作站不能上網(wǎng)了。難道處于長(zhǎng)亮狀態(tài)的交換機(jī)發(fā)生了硬件損壞,筆者心中自言自語(yǔ)道!?為了檢驗(yàn)工作狀態(tài)不正常的交換機(jī)是否發(fā)生了硬件損壞,筆者特意將該交換機(jī)的電源線纜暫時(shí)拔掉,過(guò)一段時(shí)間后將電源線纜重新插入其中,以便嘗試重新啟動(dòng)一下交換機(jī);幸運(yùn)的是,故障交換機(jī)被筆者重新啟動(dòng)之后,局域網(wǎng)中先前不能上網(wǎng)的工作站都能正常上網(wǎng)了,而且上網(wǎng)速度也恢復(fù)到以前的正常狀態(tài)了。原以為到了這里,局域網(wǎng)部分工作站不能上網(wǎng)的故障得到解決了;可讓人感到納悶的是,筆者剛剛準(zhǔn)備拔腿離開(kāi)機(jī)房,又有同事開(kāi)始嚷嚷說(shuō)網(wǎng)絡(luò)又出問(wèn)題了。再次來(lái)到交換機(jī)旁,筆者發(fā)現(xiàn)那臺(tái)剛被重新啟動(dòng)的故障交換機(jī),現(xiàn)在又是所有的信號(hào)燈處于長(zhǎng)亮不閃爍狀態(tài)了,而且此時(shí)其他兩臺(tái)交換機(jī)仍然保持以前的運(yùn)行狀態(tài),這是怎么回事呢?
盡管筆者知道局域網(wǎng)中不少工作站都感染有各種危害不一的網(wǎng)絡(luò)病毒,可是考慮到兩臺(tái)次交換機(jī)無(wú)論是品牌型號(hào)方面,還是連接方式方面,甚至是參數(shù)配置方面都是完全相同的,如果交換機(jī)的故障是由網(wǎng)絡(luò)病毒誘發(fā)的話,那表現(xiàn)出來(lái)的癥狀應(yīng)該是兩臺(tái)次交換機(jī)都不能正常運(yùn)行才對(duì);現(xiàn)在只有一臺(tái)次交換機(jī)運(yùn)行不正常,另外一臺(tái)次交換機(jī)始終保持正常運(yùn)行狀態(tài),因此筆者估計(jì)出現(xiàn)故障的那臺(tái)次交換機(jī)十有八九發(fā)生了硬件方面的損壞,
電腦資料
《網(wǎng)管故障實(shí)戰(zhàn):交換機(jī)癱瘓禍起自身免疫力》(http://www.oriental01.com)。于是筆者初步認(rèn)為,要想解決這樣的網(wǎng)絡(luò)故障,唯一的辦法就是用另外一臺(tái)工作正常的交換機(jī)來(lái)替換故障交換機(jī)。由于當(dāng)時(shí)單位沒(méi)有現(xiàn)成的空閑交換機(jī)可以更換,筆者就沒(méi)有將那臺(tái)故障交換機(jī)從局域網(wǎng)中移走,準(zhǔn)備第二天早點(diǎn)過(guò)來(lái)帶一臺(tái)新交換機(jī)進(jìn)行更換操作。但讓人感到十分意外的是,當(dāng)筆者第二天來(lái)到局域網(wǎng)機(jī)房時(shí),卻發(fā)現(xiàn)昨天工作狀態(tài)不正常的交換機(jī),突然變得正常起來(lái)了,這是怎么回事呢?筆者看看交換機(jī),又下意識(shí)地看了看機(jī)房外面的局域網(wǎng)工作站,突然想到一定是局域網(wǎng)工作站在沒(méi)有運(yùn)行的情況下,網(wǎng)絡(luò)中就不存在病毒,那么交換機(jī)就不會(huì)受到病毒攻擊,這也是故障交換機(jī)在無(wú)人使用計(jì)算機(jī)的情況下能夠恢復(fù)正常工作狀態(tài)的最好解釋吧。隨后發(fā)生的事情,的確也驗(yàn)證了筆者的推斷;當(dāng)同事們陸續(xù)上班開(kāi)始使用計(jì)算機(jī)進(jìn)行工作時(shí),故障交換機(jī)的信號(hào)指示燈立即又恢復(fù)到以前的長(zhǎng)亮不閃爍狀態(tài)了,筆者估計(jì)此時(shí)局域網(wǎng)工作站中的網(wǎng)絡(luò)病毒又開(kāi)始不斷向網(wǎng)絡(luò)發(fā)送廣播信息了,直到廣播風(fēng)暴導(dǎo)致交換機(jī)癱瘓為止。后來(lái)筆者動(dòng)員單位的同事,都將自己的工作站系統(tǒng)重新安裝一下,以便徹底消滅局域網(wǎng)網(wǎng)絡(luò)中的病毒;當(dāng)所有工作站全部重新安裝過(guò)操作系統(tǒng)后,那臺(tái)有故障的交換機(jī)立即就能恢復(fù)正常運(yùn)行狀態(tài)了,而且持續(xù)很長(zhǎng)時(shí)間都沒(méi)有發(fā)生異,F(xiàn)象。
問(wèn)題總結(jié)
到了這里,導(dǎo)致交換機(jī)癱瘓的罪槐禍?zhǔn)姿坪蹙褪蔷钟蚓W(wǎng)中的網(wǎng)絡(luò)病毒了。可是有一點(diǎn)還是讓筆者耿耿于懷,那就是網(wǎng)絡(luò)病毒為什么只對(duì)其中一臺(tái)交換機(jī)產(chǎn)生影響,而不對(duì)另外一臺(tái)交換機(jī)產(chǎn)生影響呢?后來(lái)到網(wǎng)上搜索相關(guān)資料,筆者發(fā)現(xiàn)即使品牌、型號(hào)完全相同的交換機(jī),它們的運(yùn)行性能也不一定完全相同;例如兩臺(tái)完全一致的交換機(jī),如果它們的運(yùn)行環(huán)境不一致的話,那么交換機(jī)內(nèi)部元器件的老化速度就不一樣,老化速度快的交換機(jī)在日后的工作中,抵抗外界干擾包括病毒干擾的能力就相對(duì)要差一些了,這就是為什么網(wǎng)絡(luò)病毒只導(dǎo)致一臺(tái)交換機(jī)癱瘓,而另外一臺(tái)交換機(jī)安然無(wú)恙的原因了。依照這樣的分析思路,筆者認(rèn)為上面所提的故障交換機(jī)之所以會(huì)發(fā)生癱瘓,究其真實(shí)原因其實(shí)是該交換機(jī)自身免疫力較差,導(dǎo)致該交換機(jī)無(wú)法抵抗網(wǎng)絡(luò)病毒的襲擊;相比較而言,另外一臺(tái)型號(hào)完全一致的交換機(jī)之所以始終保持正常的運(yùn)行狀態(tài),那是因?yàn)樵摻粨Q機(jī)性能好、自身抵抗力強(qiáng),網(wǎng)絡(luò)病毒的破壞力還不足以讓其癱瘓。
總結(jié)上面的故障排除過(guò)程,筆者認(rèn)為要想有效避免交換機(jī)發(fā)生癱瘓或其他不可知故障,首先要做到的就是在挑選交換機(jī)的時(shí)候,不能貪圖眼前便宜,去購(gòu)買那些品牌不正、質(zhì)量不好的產(chǎn)品,而應(yīng)該盡量挑選那些品牌正、性能好、緩存容量大的產(chǎn)品,以確保交換機(jī)自身能有足夠強(qiáng)大的免疫能力,去抵抗網(wǎng)絡(luò)中存在的各種外來(lái)干擾;其次要在局域網(wǎng)中的每臺(tái)工作站中安裝好正版的殺毒軟件,并且要求定期對(duì)系統(tǒng)進(jìn)行病毒查殺操作,及時(shí)進(jìn)行在線更新病毒庫(kù)操作,確保網(wǎng)絡(luò)病毒不引發(fā)廣播風(fēng)暴。另外還需要提醒各位的是,為了讓交換機(jī)始終處于高效的運(yùn)行狀態(tài),我們不妨在網(wǎng)絡(luò)訪問(wèn)的空閑時(shí)段,抽出時(shí)間將交換機(jī)電源斷開(kāi),然后過(guò)一會(huì)兒重新接通它的電源,這樣一來(lái)就能實(shí)現(xiàn)清空交換機(jī)緩存的目的,以便進(jìn)一步增強(qiáng)交換機(jī)的免疫力。