聯系人: | 許先生 |
手 機: | 18062413380 |
電 話: | 027-87166845 027-87990605 |
郵 箱: | hbwhjf@163.com |
傳 真: | 027-87166845 |
地 址: | 武漢市洪山區華師園北路18号光谷科技港4樓 |
前言:
科技改變生活,科技的發展讓我們的生活越來越精彩豐富,數據中心機房監控系統也可以稱爲“自我監控系統”,主要是針對機房所有的設備及環境進行集中監控和管理的,其監控對象構成機房的各個子系統:動力系統、環境系統、消防系統、保安系統、網絡系統等,通過監控系統采集數據中心機房運行的各種數據參數來判斷是否出現異常,以便運維的人員做出積極準确的判斷,因此監控系統對于數據中心機房尤爲重要。
數據中心機房的監控系統其實是包含多方面的,而不是簡單的視頻監控,當數據中心機房出現一些隐患時,通過監控系統及時發現,就可以将危險消滅在搖籃之中,理論上,在數據中心機房裏任何地方,任何運行的系統都有出問題的可能,監控系統是否完全能覆蓋到将在一定程度上決定了數據中心機房運行的穩定性,任何一個數據中心機房都有監控系統,區别僅在于監控系統做的完善程度上,一座數據中心機房在正式投入運營之前,就需要對數據中心機房的運轉做好完面的監控系統,下面詳解數據中心機房中三大重要監控系統以及在高質量的數據中心機房裏,監控系統裏都有哪些鮮爲人知的功能。
(一)數據中心機房之“設備監控系統”
數據中心機房裏的設備成千上萬,對這些設備的運行情況進行監控非常必要,比如服務器運行的CPU内存參數,網絡設備的端口流量,業務層面的監控等等,設備層面的監控就更爲複雜了,需要對設備的各種運行參數比較清楚,因此一般設備的監控系統都采用設備廠家提供的監控軟件或者标準的第三方軟件來進行管理。
(1)通過這些監控軟件,7*24小時對設備運行的各種參數進行監控,一旦發現有異常就發出告警。
(2)告警的方式也比較多,可以打印到日志主機上,可以通過短信發送到運維人員的手機上,也可以通過軟件系統自行嘗試修複。
(3)監控的軟件做的是否完善将決定故障出現時,能否給出告警,所以涉及設備的監控往往是在不斷完善的過程,很多監控參數都是經驗之道,甚至是曆史的教訓,隻有通過不斷地改進、優化,才能将發生的風險及時發現,當然要做到所有的故障都可能提前預知、發現,是非常困難的。
(4)有時的故障可能無任何征兆,尤其是硬件故障,會突然出現,而往往監控系統是無法監測到硬件級别的、元器件的故障。
(二)數據中心機房之“視頻監控系統”
和其它的商務建築一樣,數據中心機房也需要部署視頻監控系統。視頻監控主要是對進出數據中心機房的人員進行監控,在數據中心機房的出入口要部署攝像頭,在數據中心機房内部樓道,重要的機房入口都要部署。
在有的非常重要業務的機房内,有時也要部署攝像頭,以便防止一些人員的惡意操作或者誤操作,發現這些異常時及時制止,以防止給數據中心機房業務帶來影響。數據中心機房裏的很多設備、儀器都是非常昂貴的,因爲人爲的原因導緻損壞的情況是非常多見的,還有就是防止一些偷盜行爲。比如數據中心機房裏的光模塊,一個光模塊,尤其是40G/100G光模塊,一個都要數千元,順手拿出去幾個,轉手可以獲利上萬元。
有了視頻監控系統,就能最大限度地避免這些行爲出現,或者在出現後可以通過這些監控錄像進行分析、追責,這些視頻錄像是重要的證據,所以視頻監控系統是數據中心機房不可缺少的一部分,有的數據中心機房除了視頻的監控,還要在數據中心機房出入做好人員訪問登記工作,對外來人員進行管理,避免放入一些惡意分子。
(三)數據中心機房之“煙霧溫濕監控系統”
數據中心機房一樣怕火,一旦發生火災對于數據中心機房來說就是毀滅性的打擊。以往也出現過一些慘痛的教訓,所以對于放火,數據中心機房且不可大意。數據中心機房和其它的建築不同,内部有太多的電子設備,并不适用于噴淋系統,隻能采用幹粉滅火或者惰性氣體滅火。
當機房内的煙霧濃度超過了報警器設定的門限,即觸發監控系統,及時将火滅除,除了煙霧,機房内的溫度和濕度也是需要監控的重要部署。數據中心機房内部要盡量保持恒溫恒濕,但實際上在數據中心機房内部會有局部的溫度死角,長期以往會大大降低電子設備的使用壽命,通過在數據中心機房内多個區域部署溫濕度傳感器,建立起溫濕度的監控網絡,就可以及時地發現局部區域過溫過濕的情況,在一些空氣污染較爲嚴重的地方,還可以部署空氣清潔度監測的設備,數據中心機房設備運行在污染嚴重的環境裏,容易造成靜電、電容擊穿器件等故障,爲何我們要求數據中心機房設備要周期性地進行除塵就是這個道理,本身灰塵中就含有不少的污染物。
數據中心機房在高速的發展,各種新技術層出不窮,也讓數據中心機房運行變得愈加複雜,這給監控系統也帶來了不小的挑戰,如何通過監控系統及時發現運行風險,是監控系統關心的永恒話題。
盡管數據中心機房有各種各樣的監控系統,但是可以确定的是監控系統無法提前發現所有的故障,尤其是設備級别的故障,但是通過完善的監控系統的确可以大大避免很多故障。就算監控系統沒有在發生故障時,給出告警,但是在事後故障分析中,監控系統的各種技術參數和記錄依然是可供分析的重要資料,通過對這些監控記錄很可能可以找出故障的原因。 監控系統的作用就是将曆史經驗、教訓轉化爲一些數據參數,然後采集數據中心機房裏的各種數據信息進行對比,如果發現異常,就及時給出告警。數據越豐富,監控系統的功能就越強大。
總結:
不要以爲一個數據中心機房不是部署了監控系統就可以高枕無憂了,任何的系統都有漏洞,何況是監控系統,所以數據中心機房運維人員還要在日常的工作中,多檢查,多分析,及時發現隐患,如果監控系統未能發現,那麽想辦法将這些隐患的判斷加到監控系統中,使監控系統越來越完善,決不能允許相同的錯誤,連續犯兩次。