監(jiān)控的目標(biāo)?
發(fā)現(xiàn)問題:當(dāng)系統(tǒng)發(fā)生故障報警,我們會收到故障報警的信息。定位問題:故障郵件一般都會寫某某主機(jī)故障、具體故障的內(nèi)容,我們需要對報警內(nèi)容進(jìn)行分析。比如一臺服務(wù)器連不上,我們就需要考慮是網(wǎng)絡(luò)問題、還是負(fù)載太高導(dǎo)致長時間無法連接,又或者某開發(fā)觸發(fā)了防火墻禁止的相關(guān)策略等,我們就需要去分析故障具體原因。解決問題:當(dāng)然我們了解到故障的原因后,就需要通過故障解決的優(yōu)先級去解決該故障??偨Y(jié)問題:當(dāng)我們解決完重大故障后,需要對故障原因以及防范進(jìn)行總結(jié)歸納,避免以后重復(fù)出現(xiàn)。
具體而言?
對系統(tǒng)不間斷的實時監(jiān)控:實際上是對系統(tǒng)不間斷的實時監(jiān)控(這就是監(jiān)控);實時反饋系統(tǒng)當(dāng)前狀態(tài):我們監(jiān)控某個硬件、或者某個系統(tǒng),都是需要能實時看到當(dāng)前系統(tǒng)的狀態(tài),是正常、異常、或者故障。保證服務(wù)可靠性安全性:我們監(jiān)控的目的就是要保證系統(tǒng)、服務(wù)、業(yè)務(wù)正常運行保證業(yè)務(wù)持續(xù)穩(wěn)定運行:如果我們的監(jiān)控做得很完善,即使出現(xiàn)故障,能時間接收到故障報警,在時間處理解決,從而保證業(yè)務(wù)持續(xù)性的穩(wěn)定運行。