• 小批量定制機房監控系統廠(chǎng)家

    南寧邁世信息技術(shù)有限公司

    全國咨詢(xún)熱線(xiàn):400-030-5510

    您好,歡迎進(jìn)入南寧邁世信息技術(shù)有限公司!收藏本站在線(xiàn)留言網(wǎng)站地圖

    中國中小機房監控解決方案供應商

    醫療IT運行監控系統設計

    來(lái)源: 發(fā)布日期: 2018.03.01
    1、機房監控

    醫院信息系統機房是服務(wù)器、網(wǎng)絡(luò )及其附屬設備運行的環(huán)境和場(chǎng)所,在國家標準GB50174-2008 《電子信息系統機房設計規范》中,對其建設和運行指標有詳細的約定,其中應進(jìn)行監控的重點(diǎn)是配電系統和環(huán)境溫濕度。

    0.1

    (1)配電系統
    配電系統包括市電供應、不間斷電源和發(fā)電機三部分。
    對市電供應應監控電能質(zhì)量,主要指標包括開(kāi)關(guān)狀態(tài)、電流、電壓、有功功率、功率因數、諧波含量。
    不間斷電源就是常說(shuō)的UPS(UninterruptiblePower System),其主要監控指標為:監控輸入和輸出功率、電壓、頻率、電流、功率因數、負荷率;電池輸入電壓、電流、容量;同步/不同步狀態(tài)、不間斷電源系統/旁路供電狀態(tài)、市電故障、不間斷電源系統故障;監控蓄電池的電壓、阻抗和故障。
    對發(fā)電機系統應監控:油箱(罐)油位、柴油機轉速、輸出功率、頻率、電壓、功率因數。此外,機房的PUE( P o w e r Us a g e Effectiveness)值是評價(jià)機房能耗的一個(gè)重要指標,它表示機房總設備能耗與IT設備能耗的比值。在監控系統中,我們可以通過(guò)采集到的電壓電流數據,計算出實(shí)時(shí)的PUE值。
    (2)環(huán)境溫濕度
    環(huán)境溫濕度指標是機房環(huán)境中最重要的指標,業(yè)內有“溫度每升高10度,設備使用壽命減半”的說(shuō)法,因此維持機房溫濕度恒定是對機房環(huán)境的基本要求。對空調系統應監控開(kāi)關(guān)、制冷、加熱、加濕、除濕的運行狀態(tài);相對溫度、相對濕度、傳感器故障、壓縮機壓力、加濕器水位、風(fēng)量設置閥值,超出報警。在空調、水管、窗戶(hù)等易產(chǎn)生水源泄露的部位,應安裝漏水感應裝置,并監控其狀態(tài)。對機房環(huán)境,應監控房間各區域以及機柜內部的溫度、濕度數據以及變化趨勢。監控探頭應放置在被監控設備的入風(fēng)口位置,如:對于下送風(fēng)上回風(fēng),設置冷熱通道的機房,應監控其冷通道頂部的溫度。
    2、主機系統監控

    絕大多數的主機系統監控是基于SNMP協(xié)議(Simple NetworkManagement Protocol/簡(jiǎn)單網(wǎng)絡(luò )管理協(xié)議)的。SNMP是應用最為廣泛的TCP/IP 協(xié)議,采用了Server/ Client的模式,通過(guò)管理端與SNMP代理間的交互工作完成對設備的管理;而 MIB(Management Information Base 管理信息庫)包是解讀SNMP消息內容的字典,MIB包以文本形式保存樹(shù)狀的代碼信息,每個(gè)分支代表一種類(lèi)型的統計信息或狀態(tài)信息。通過(guò)SNMP代理可以響應管理端關(guān)于MIB信息的各種查詢(xún),如:get,getnext,set等。被管設備還可以通過(guò)發(fā)送TRAP包的形式主動(dòng)向管理端發(fā)送緊急報警信息,從而實(shí)現對設備的監控。

    邁世信息

    (1)存儲系統
    對于存儲系統,除了通用的基于SNMP協(xié)議的監控,還可以通過(guò)SMI-S協(xié)議( StorageManagement Initiative Speci?cation,主動(dòng)存儲管理規范)獲取更多的設備信息。SMI-S協(xié)議是SNIA (StorageNetworking Industry Association,美國存儲網(wǎng)絡(luò )工業(yè)協(xié)會(huì ))提出的存儲管理的接口標準,它使存儲管理可以真正實(shí)現與廠(chǎng)商無(wú)關(guān),從而降低管理成本,提高管理效率。當前主流的存儲設備廠(chǎng)商,如:IBM、博科、EMC、NetAPP、浪潮、 HP等都支持該協(xié)議?;赟MI-S協(xié)議,監控軟件可以自動(dòng)獲取HBA 主機、FC交換機、FC數據存儲設備以及光纖通道狀態(tài),并生成存儲拓撲,以圖形化的方式實(shí)現對存儲設備資源的統一管理。
    (2)服務(wù)器
    對硬件故障的監控可以采用基于IPMI (Intelligent Platform Management Interface,智能平臺管理接口)的數據采集方式。IPMI是管理基于 Intel結構的企業(yè)系統中所使用的外圍設備采用的一種工業(yè)標準,該標準由英特爾、惠普、NEC、美國戴爾電腦和SuperMicro等公司制定,用戶(hù)可以利用IPMI監視服務(wù)器的物理健康特征,如溫度、電壓、風(fēng)扇工作狀態(tài)、電源狀態(tài)等。如用戶(hù)可以通過(guò)IBM X系列服務(wù)器的控制網(wǎng)口連接主板的集成管理模塊,收集服務(wù)器硬件物理狀態(tài)。對于服務(wù)器性能監控最主要的3個(gè)指標是CPU利用率、內存利用率和文件系統使用率。系統管理員應經(jīng)常對以上指標的歷史數據進(jìn)行分析,如有利用率過(guò)高的情況,應結合應用場(chǎng)景分析,及時(shí)處理。
    (3)虛擬化監控
    VMware虛擬化解決方案是當前最常用的虛擬化技術(shù),其自帶的vCenter管理工具可以很方便的監控和管理vSphere運行環(huán)境。不少監控軟件也包括類(lèi)似vCenter的虛擬化管理模塊,甚至可以通過(guò) API接口對不同品牌的虛擬化管理平臺進(jìn)行整合,接收從虛擬化設備發(fā)出SNMP TRAP信息,生成自己的監控界面,方便系統管理員進(jìn)行管理。 
    (4)服務(wù)與日志監控
    監控軟件還應支持對操作系統進(jìn)程的監控,判斷其所使用的資源比例和健康狀況,還應對基礎應用服務(wù)的核心端口、HTTP、FTP、POP3、SMTP、 DNS、NTP等服務(wù)可用性和響應時(shí)間的監控。日志監控是指對windows日志、syslog日志或其他文本類(lèi)型的日志監控管理,對接收到的日志信息進(jìn)行存儲、分析并報警。對日志的監控主要通過(guò)關(guān)鍵字檢索或事件ID識別來(lái)實(shí)現,日志報警應支持邏輯判斷,設置不同的級別,對不需產(chǎn)生報警的事件進(jìn)行例外排除。
    3、數據庫監控
    保證數據可靠安全是保證信息系統高可用性的最終目的。
    進(jìn)行數據庫的調優(yōu)和管理數據備份是 DBA的主要職責。對數據庫的監控主要關(guān)注可用狀態(tài)、性能和空間容量三個(gè)方面??捎脿顟B(tài)是指被監控的數據庫是否能正常訪(fǎng)問(wèn),特定進(jìn)程或服務(wù)是否狀態(tài)正常;性能指標包括連接數是否過(guò)大、讀緩存命中率是否過(guò)低、寫(xiě)緩存命中率是否過(guò)低、死鎖數量是否過(guò)大、回滾數是否過(guò)高等;空間容量是指監測表空間和數據文件的大小、狀態(tài)和使用率、數據庫碎片比率等。以Oralce數據庫為例,我們在實(shí)際工作中監控了以下指標:
    (1)Session數
    (2)后臺進(jìn)程狀態(tài)(SMON、PMON、DBWn、LGWR、CKPT等)
    (3)PGA狀況(內存爭用比、PGA使用率、 PGA命中率)
    (4)SGA狀況(Buffercache命中率、庫緩存命中率、數據字典命中率、共享池命中率、回滾段爭用比)
    (5)表空間利用率、日志使用情況
    另外,檢查數據備份是否成功是系統管理員的日常工作,常用的備份軟件有IBM的TSM、 Symantec的Veritas Netbackup等,監控系統應可集成其狀態(tài)和報警。
    4、網(wǎng)絡(luò )監控
    網(wǎng)絡(luò )相當于醫院信息系統的神經(jīng)中樞,各種網(wǎng)絡(luò )設備分布于各樓層配線(xiàn)間中,最難于管理。采用人工巡檢時(shí),只能觀(guān)察到某個(gè)時(shí)點(diǎn)的設備通斷狀況和有無(wú)報警信息,無(wú)法實(shí)時(shí)全面的了解整個(gè)網(wǎng)絡(luò )的運行情況。
    采用IT運行監控系統,可以從以下幾個(gè)方面著(zhù)手,對網(wǎng)絡(luò )運行狀況進(jìn)行全面的監控:通過(guò)網(wǎng)絡(luò )拓撲圖,網(wǎng)絡(luò )管理員可以直觀(guān)的查看網(wǎng)絡(luò )邏輯拓撲圖和網(wǎng)絡(luò )物理拓撲圖,及時(shí)發(fā)現網(wǎng)絡(luò )的邏輯和物理問(wèn)題。拓撲圖通過(guò)使用不同的圖標來(lái)表示不同網(wǎng)絡(luò )對象,用不同的顏色來(lái)表示不同的設備運行狀況。
    網(wǎng)絡(luò )故障通常會(huì )影響到一片而不是一個(gè)信息節點(diǎn),網(wǎng)絡(luò )拓撲圖上數據和信息有助于管理員快速的確定故障影響范圍,從而進(jìn)一步判斷故障產(chǎn)生的原因。在實(shí)時(shí)顯示網(wǎng)絡(luò )運行狀況信息的同時(shí),運行監控系統可以將這些運行數據(如:設備CPU、內存利用率;設備各端口出入流量、平均包長(cháng)及丟包、錯包率等)記錄下來(lái),用于以后的數據分析。
    通過(guò)歷史曲線(xiàn)比對,TOP N數據分析等手段,可以了解設備的利用情況以及網(wǎng)絡(luò )性能的瓶頸。IP地址管理工具可以自動(dòng)發(fā)現網(wǎng)絡(luò )上在用的設備的IP地址,幫助網(wǎng)絡(luò )工程師發(fā)現網(wǎng)絡(luò )上有哪些IP 地址可用。通過(guò)與基準表中IP地址范圍和子網(wǎng)設置信息的對比,判定IP地址的在線(xiàn)、未登記或非法接入狀態(tài),并以不同的圖標進(jìn)行展示,支持IP地址登記管理,查看在線(xiàn)IP地址的登記狀態(tài),根據條件批量的變更IP地址的登記狀態(tài)。
    IP地址管理工具還可以自動(dòng)發(fā)現IP地址和MAC地址的對應關(guān)系,建立MAC地址IP地址的綁定關(guān)系,并根據設置的策略進(jìn)行阻斷或報警。此外,有的監控軟件還可以實(shí)現自動(dòng)巡檢功能,定期自動(dòng)采集設備運行參數,形成巡檢報告;還有的監控軟件可以對網(wǎng)絡(luò )設備的配置信息自動(dòng)備份、批量更新配置信息;在無(wú)線(xiàn)網(wǎng)絡(luò )管理方面,有的監控軟件可以圖形化的展示建筑物中的AP節點(diǎn)和信號強度,掃描用戶(hù)數量、位置等,也是一個(gè)值得探索的方向。
    5、業(yè)務(wù)拓撲視圖
    對IT基礎設施的監控是為了保障業(yè)務(wù)軟件的運行,監控系統應提供所見(jiàn)即所得的業(yè)務(wù)和資源建模能力,從業(yè)務(wù)角度出發(fā),將組成業(yè)務(wù)系統的IT資源按照其關(guān)聯(lián)關(guān)系、權重等組成業(yè)務(wù)邏輯模型進(jìn)行監控,建立從業(yè)務(wù)視角出發(fā)的監控視圖。當業(yè)務(wù)應用出現故障時(shí),能清晰展現所影響的服務(wù)及部門(mén);每個(gè)業(yè)務(wù)服務(wù)對應一張業(yè)務(wù)拓撲視圖,能從客戶(hù)端、業(yè)務(wù)軟件、IT基礎設施不同層面展現關(guān)聯(lián)關(guān)系,當 IT資源產(chǎn)生異常時(shí),能夠高亮顯示報警及故障的傳遞關(guān)系。
    配備有中間件和數據庫服務(wù)器兩組主機,數據庫主機上又運行著(zhù)數據庫監控,中間件主機做了Windows集群,上面還有相應的Weblogic的進(jìn)程。以上信息都可以以OA系統為索引,展示在同一業(yè)務(wù)拓撲視圖中。推而廣之,對于業(yè)務(wù)本身的一些指標,如當日掛號數、已就診人數、處方數、檢查檢驗申請等也可納入業(yè)務(wù)拓撲圖,并對數據在不同業(yè)務(wù)系統中的流向進(jìn)行配置和標識,這樣的從業(yè)務(wù)負載到IT基礎設施保障情況的一體化視圖,就可以清晰地反映出整個(gè)醫院信息系統的運營(yíng)狀況。
    6、報警管理
    在信息部門(mén)的辦公區應設置監控大屏,播放IT運行監控系統的運維門(mén)戶(hù)視圖,集中顯示信息系統整體運行狀況,包括:IT資產(chǎn)統計、報警列表、機房環(huán)境監控圖、服務(wù)器位置及拓撲、全院網(wǎng)絡(luò )拓撲、數據庫狀態(tài)、應用系統定期作業(yè)執行情況等。

    對于故障報警,應包括但不限于聲光電、短信、郵件、手機App等多種方式。如:當IT運行監控系統收到 SNMP TRAP報警信息或檢測到超過(guò)了預先設定的閥值時(shí),會(huì )通過(guò)短信模塊向管理員手機發(fā)送短信報警,同時(shí)監控大廳的報警燈閃爍并蜂鳴報警,運維門(mén)戶(hù)的拓撲圖上標示出故障位置。故障等級設為三檔,正常、提醒和警告。系統通過(guò)撥測自檢,確保自身運轉正常;當發(fā)現異常數據但不影響系統正常使用時(shí)生成提示信息,當判斷故障需要緊急處理時(shí)顯示為警告。此外還需注意避免報警風(fēng)暴的產(chǎn)生,如:同樣內容的報警30分鐘只有顯示一次,同類(lèi)型的報警整合成一條等。

    本文轉載自其他網(wǎng)站


    邁世官網(wǎng): www.1800rentme.com
    咨詢(xún)熱線(xiàn): 400-030-5510 立即咨詢(xún)
    【推薦機房監控解決方案】

    咨詢(xún)熱線(xiàn)

    400-030-5510

    智慧機房在線(xiàn)體驗

    邁世·機房監控體驗端

    用戶(hù)名:Admin密碼:(無(wú)密碼) 點(diǎn)擊體驗
    久久国产乱子伦精品免费台湾|国产乱精品女同自线免费|国产97人人乐人人爱|亚洲精品nV久久久久久久久|欧美大香线蕉线伊人久