“狂人,快來救救急!客戶的網絡老是斷,今天是車間突然斷網,生產線都停了!”
一大早接到電信協同排查的電話,語氣里滿是焦灼。要知道車間網絡一旦中斷,掃碼入庫、設備聯網監控全得停擺,每耽誤一分鐘都是真金白銀的損失。
掛了電話,我們立刻帶齊工具趕去現場,路上還在復盤客戶之前提到的一個細節:幾個月來辦公室經常會斷網,但刷新幾次又能恢復,本以為是小毛病沒當回事,沒想到今天車間直接“罷工”,而且怎么折騰都連不上。
第一重隱患:藏在IP里的“小錯誤”
到了現場先從“老問題”查起——既然偶爾斷網且刷新能恢復,大概率是網絡配置問題或者設備性能問題。
交換機是傻瓜交換機,那就沒什么好看的了,但是網絡接口的燈,怎么感覺那么怪呢?
不管了,先看路由器吧,剛登錄WEB界面,一眼就看到了問題:子網掩碼255.255.255.0。
不可能,絕對不可能,電信絕不會這么大方,直接給一整段公網IP?那不是天方夜譚么?
抬頭看了一眼光貓,果然應該是255.255.255.252,迅速修改后,這個垃圾路由還不立即生效,還非得重啟一下。
重啟后,上網正常,暫時也沒有出現需要刷新的故障現象,但是,由于時間還短,未必就不會再出現同樣的故障現象了,也許還有其他問題,還沒排查到。
但這個時候,更急的顯然是車間的網絡,那就繼續排查,看看究竟是什么問題?
![]()
第二重奇葩:亮著燈的“壞零件”
到車間后,筆記本電腦接入交換機,順利獲取到IP,ping網關能通,ping外網卻完全超時。
tracert -d 某網址。能解析出IP,也能走到外網去,看似正常,但是打開瀏覽器,無法上網。
怪,真怪,全是傻瓜交換機,既然有了IP,ping網關也能通,tracert 都出去了,憑什么不能上網?
跳過交換機,筆記本電腦直插光纖收發器,故障還是一樣,但又不太一樣:IP正常獲取到,ping網關也能通,但是tracert出不去了。
觀察光纖收發器,這個燈的閃爍頻率,怎么看就怎么怪,那重啟光纖收發器吧。
tracert出去了幾跳,后面立即不行了,但是ping網關的窗口沒關,除了重啟的時候斷了幾個包,后面沒掉過,一直是通的狀態。
真是怪了,算了,不折騰了,換光纖收發器吧。
筆記本電腦瞬間恢復了網絡,把交換機連上,車間的生產設備也陸續恢復了聯網!原來問題真的出在光纖收發器上,沒想到啊,這玩意兒居然“裝死”都這么逼真。
復盤:兩個故障給我們的警示
復盤這次的排查經歷,兩個故障點其實都藏著小教訓:
固定IP配置別大意:很多人覺得填對IP就行,忽略了子網掩碼、網關這些“配套設置,一定要和網絡服務商確認準確的配置參數,避免因小錯誤導致間歇性斷網。
別被硬件指示燈“騙了”:指示燈亮不代表設備完全正常,像這次的光纖收發器,可能是內部光電轉換模塊有故障,更換后,機房交換機的燈,看著也正常了。
最后想問大家:你們在工作中遇到過哪些“燈亮卻故障”的奇葩設備問題?歡迎在評論區分享你的排查經歷~ 覺得有用的話,別忘了點贊收藏,轉發給身邊搞IT運維的朋友!
關注《IT狂人日志》,下次分享更多網絡排查的實用技巧!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.