前段時間,在一家企業當信息部門經理的朋友找我求助,原來是他們SAP系統突然登錄不上,重啟服務出現了Stop狀態,現在銷售單子無法錄入、采購無法收貨、財務無法做賬,公司業務一團亂,知道我是搞系統管理的Basis顧問,找我幫忙求助。
我登進去一看,發現是HANA數據庫連不上,進到數據庫主機,服務居然停了,在線日志盤也滿了,用文件鏈接的方式處理之后發現索引服務啟動不了,服務崩潰,查看數據庫日志以及Linux日志,原來是機器異常斷電過,數據庫出現損壞。
![]()
沒辦法,只能恢復HANA數據庫,然后我驚恐地發現HANA的最后一次成功備份是在兩天前,原來備份盤早就滿了。
我就很無語,問他公司的Basis或者hana管理員,甚至是管理服務器的都沒有人例行檢查么?他也很驚恐,這塊平時都好好的,管理SAP和HANA的Basis顧問跳槽之后就沒有再補招,總覺得系統挺穩定的就不著急,哪知道不到兩個月就出現幺蛾子。
我跟他說,Basis這種系統管理員就像是扁鵲,都是“好治不病”,往往是在系統有初期的狀況甚至還沒有癥狀就處理掉了,防患于未然,系統根本沒有停擺的機會,所以大家總是有一種假象以為系統管理員沒那么重要,以為系統足夠穩定
那能怎么辦,只能拿最后一次備份進行恢復了,ERP系統丟失了兩天的數據!
![]()
事件的后果當然很嚴重,數據丟失屬于非常重大系統故障,他毫無意外地被公司發文警告,工作勉強保住了,但三年內無法獲得加薪和晉升,即將到手的副總監職位也沒了。
朋友很委屈,自己一直勤勤懇懇做事,這兩年公司拓展了很多業務,并購了很多子公司,SAP系統上了很多項目,雖然工作量大了,但自己在人員編制上一直壓著沒有增加,自己是在給公司“降本增效”,在給公司省錢,怎么就因為一次不可控的系統故障就對實施自己這么重懲罰?
我毫無顧慮得譏笑他,你看是在給公司省錢,但是屬于那種自斷臂膀式的省錢,如今系統出了故障,公司可不會記得你之前降了多少本增了多少效,事故就是事故,你是第一責任人,工作能保住沒被降職已經是大幸了,就不要再喊冤屈了,趕緊查缺補漏,調整一下人員結構,把很多系統重點預警都列入日常管理維護清單吧。
這已經不是我第一次遇到過這種情況了,有一些部門管理人員為了節約成本,甚至把心思放在系統硬件材料上。我就遇到過固態硬盤買不起,直接用用戶淘汰下來的PC機械硬盤來安裝SAP系統的,用戶怨聲載道,到處投訴系統運行卡頓。
![]()
所以,可以省錢節約成本,但該花錢就花錢,IT系統的建設本來就不應該想著省錢,不要讓自己處于被動和危險的境地,出事故老板可不會念著你曾經的妥協和省錢,而系統的崩潰往往出現在你以為的穩健之中。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.