早在好幾年前,我就在天翼云服務(wù)器上部署了Zabbix,用于監(jiān)測(cè)客戶的服務(wù)器,以及關(guān)鍵的網(wǎng)絡(luò)設(shè)備,比如防火墻、路由器、核心交換機(jī)等等。
并且也部署了堡壘機(jī),以便于安全地遠(yuǎn)程管理客戶的服務(wù)器和網(wǎng)絡(luò)設(shè)備。
應(yīng)該說(shuō),還是相當(dāng)有用的,很多次都提前發(fā)現(xiàn)了問(wèn)題,并妥善處理了。
這不,前天它又給我來(lái)活了——突然收到好幾封郵件警告,仔細(xì)一看,每封郵件就是一條內(nèi)存壞,一共三條內(nèi)存,都?jí)牧耍?/p>
![]()
其實(shí)這臺(tái)服務(wù)器上,原來(lái)有4條16G內(nèi)存,去年已經(jīng)壞了一條,因?yàn)椴挥绊懯褂茫腋蛻糁v了一聲,也就沒(méi)采購(gòu),估計(jì)這回是真不行了。
趕緊遠(yuǎn)程登錄iDRAC看一下,果然是“嚴(yán)重”警告。
![]()
點(diǎn)開(kāi)“內(nèi)存”查看詳細(xì)信息;
![]()
好家伙,三條內(nèi)存都是一樣的“檢測(cè)到存在嚴(yán)重錯(cuò)誤”,直接在控制臺(tái)重啟服務(wù)器,并沒(méi)有用,再看日志,還是報(bào)錯(cuò)
![]()
而且,服務(wù)器也是無(wú)法啟動(dòng)的,說(shuō)明內(nèi)存故障嚴(yán)重。
我前幾年也遇到過(guò),同樣是戴爾服務(wù)器,其中一條16G的內(nèi)存變成4G了,服務(wù)器還在跑呢,重啟也能起來(lái),只是反復(fù)提示要更換內(nèi)存條,想來(lái),不是嚴(yán)重問(wèn)題,系統(tǒng)還是能啟動(dòng)的。
但,這次顯然不行了,只能換內(nèi)存了。
![]()
iDRAC控制臺(tái)關(guān)閉服務(wù)器,開(kāi)著也沒(méi)用了,就省一晚上的電吧。
給客戶發(fā)截圖,報(bào)價(jià),由于是金蝶服務(wù)器,停一天都不行,客戶很快確認(rèn)了,第二天早上,一路趕去更換內(nèi)存。
因?yàn)樵瓉?lái)就是64G內(nèi)存,所以這次直接換了兩條32G的,算是恢復(fù)到原來(lái)的內(nèi)存容量了。
![]()
更換完成后,再次登錄 iDRAC,查看系統(tǒng)狀態(tài),內(nèi)存告警沒(méi)了,一切都正常了,另外兩個(gè)報(bào)錯(cuò),重啟后也就消失了,可能不是什么實(shí)質(zhì)性的問(wèn)題,也可能就是由內(nèi)存引起的,總之,現(xiàn)在恢復(fù)正常就行了。
![]()
趕緊提醒客戶,測(cè)試金蝶。
![]()
任務(wù)完成,趕往下一站,20多年IT運(yùn)維外包,不就是這么過(guò)來(lái)的,嘿嘿。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.