網(wǎng)絡(luò)運(yùn)維 設(shè)備管控

如何實(shí)現(xiàn)網(wǎng)絡(luò)安全監(jiān)控運(yùn)維?

銀行數(shù)據(jù)中心綜合監(jiān)控運(yùn)維方案

銀行數(shù)據(jù)中心綜合監(jiān)控運(yùn)維方案
    馬上咨詢

    ? ? ? ? 隨著金融科技的不斷變革,銀行的網(wǎng)絡(luò)整體規(guī)劃和建設(shè)思路也在不斷追趕新時(shí)代銀行業(yè)務(wù)的發(fā)展需要。隨之而來的是銀行數(shù)據(jù)中心的網(wǎng)絡(luò)規(guī)模不斷擴(kuò)大,從更初的單中心逐漸延伸到多地多中心運(yùn)營(yíng)的模式,使用的網(wǎng)絡(luò)技術(shù)也從傳統(tǒng)的交換路由、負(fù)載均衡、防火墻逐步發(fā)展到軟件定義網(wǎng)絡(luò)、網(wǎng)絡(luò)服務(wù)虛擬化等各類新興技術(shù)。?

    ? ? ? ? 同時(shí),在金融需求越來越旺盛,銀行業(yè)務(wù)發(fā)展越來越快的當(dāng)下,銀行數(shù)據(jù)中心出現(xiàn)異常運(yùn)行而造成的損失和后果就愈發(fā)嚴(yán)重。在云計(jì)算、大數(shù)據(jù)等新興技術(shù)不斷涌現(xiàn)的新形勢(shì)下,如何保障數(shù)據(jù)中心安全生產(chǎn)運(yùn)行,高效率、高質(zhì)量地運(yùn)維龐雜的網(wǎng)絡(luò)環(huán)境,已成為銀行信息科技部門的必答題。

    第1章 銀行數(shù)據(jù)中心運(yùn)維建設(shè)背景

    ? ? ? ? 根據(jù)銀監(jiān)會(huì)編制的《中國(guó)銀行業(yè)信息科技“十三五”發(fā)展規(guī)劃監(jiān)管指導(dǎo)意見》中明確指出: 提高運(yùn)維自動(dòng)化水平,打造智能化運(yùn)維體系。

    ? ? ? ? 《意見》表明:提高基礎(chǔ)資源和應(yīng)用部署的自動(dòng)化水平,實(shí)現(xiàn)快速交付、動(dòng)態(tài)調(diào)整、彈性部署,降低人工操作風(fēng)險(xiǎn),自動(dòng)化部署比例不低于75%。持續(xù)推進(jìn)生產(chǎn)運(yùn)維監(jiān)控精細(xì)化、自動(dòng)化、智能化建設(shè),強(qiáng)化系統(tǒng)風(fēng)險(xiǎn)和故障的早預(yù)警、早定位和早處置。實(shí)現(xiàn)應(yīng)用層面交易全流程、全節(jié)點(diǎn)監(jiān)控全覆蓋,結(jié)合應(yīng)用系統(tǒng)交易特性及相關(guān)數(shù)據(jù)的分析對(duì)比,提升交易過程監(jiān)控的智能化水平。強(qiáng)化容量管理,做好相關(guān)資源的動(dòng)態(tài)規(guī)劃,預(yù)防非計(jì)劃性、突發(fā)性的容量瓶頸問題發(fā)生。強(qiáng)化運(yùn)維、開發(fā)、安全、風(fēng)險(xiǎn)管理的信息共享和一體化協(xié)作,提升多方聯(lián)動(dòng)能力。加強(qiáng)運(yùn)維大數(shù)據(jù)分析,利用運(yùn)維大數(shù)據(jù)加強(qiáng)業(yè)務(wù)風(fēng)險(xiǎn)防控,探索利用運(yùn)維大數(shù)據(jù)推動(dòng)業(yè)務(wù)流程優(yōu)化并支持業(yè)務(wù)創(chuàng)新。

    第2章 銀行數(shù)據(jù)中心網(wǎng)絡(luò)運(yùn)維痛點(diǎn)

    ? ? ? ? 隨著銀行數(shù)據(jù)中心信息系統(tǒng)規(guī)模逐漸壯大,信息科技部的運(yùn)維工作任務(wù)日益繁重,傳統(tǒng)的局部、粗放、碎片化的IT運(yùn)維管理模式已經(jīng)無法滿足新形勢(shì)下業(yè)務(wù)連續(xù)性保障的實(shí)際需求。在現(xiàn)有的銀行運(yùn)維體系下,運(yùn)維管理的工作涵蓋從機(jī)房基礎(chǔ)設(shè)施,到各類網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備、服務(wù)器、操作系統(tǒng)、數(shù)據(jù)庫(kù)、中間件、各級(jí)業(yè)務(wù)系統(tǒng)所引發(fā)的各類事件和問題,如容量不足、故障恢復(fù)、災(zāi)備轉(zhuǎn)移等等內(nèi)容。

    ? ? ? ? 銀行IT運(yùn)維也面臨著應(yīng)用系統(tǒng)繁多,系統(tǒng)間關(guān)聯(lián)關(guān)系負(fù)責(zé),業(yè)務(wù)環(huán)節(jié)繁多等壓力,而在日常運(yùn)維工作中,事件處理中信息不全、問題描述不準(zhǔn)確、關(guān)鍵信息缺失等情況,也給運(yùn)維部門帶來重重困難。

    • 銀行數(shù)據(jù)中心的系統(tǒng)硬件從型號(hào)、品牌呈現(xiàn)數(shù)量多、品牌多的特點(diǎn),難以統(tǒng)一管理。
    • 支撐業(yè)務(wù)系統(tǒng)的虛擬化、云計(jì)算、大數(shù)據(jù)、微服務(wù)、容器、信創(chuàng)等技術(shù)趨勢(shì)迅速翻新,迫IT環(huán)境復(fù)雜度、規(guī)模都急劇提升;節(jié)點(diǎn)分布范圍更加廣,物理位置不統(tǒng)一,對(duì)故障定位、變更升級(jí)等運(yùn)維工作帶來新挑戰(zhàn)。
    • 新增業(yè)務(wù)需配置多廠商、多類型設(shè)備,各廠商設(shè)備配置命令千差萬(wàn)別,協(xié)議繁復(fù),配置更其復(fù)雜,大量重復(fù)性的策略開通工作,費(fèi)時(shí)費(fèi)力;而上云的業(yè)務(wù)也同樣面臨異構(gòu)多云跨廠商業(yè)務(wù)開通的難題。
    • 銀行業(yè)務(wù)的多元化發(fā)展,對(duì)系統(tǒng)和網(wǎng)絡(luò)設(shè)施的依賴性不斷增加,在傳統(tǒng)運(yùn)維方案中,難以自動(dòng)發(fā)現(xiàn)業(yè)務(wù)應(yīng)用拓?fù)潢P(guān)系和交易訪問路徑,難以直觀定位業(yè)務(wù)節(jié)點(diǎn),故障根源定位慢,缺乏對(duì)業(yè)務(wù)系統(tǒng)整體健康狀況和運(yùn)行趨勢(shì)的監(jiān)測(cè),無法判定業(yè)務(wù)系統(tǒng)是否存在運(yùn)行瓶頸。
    • 跨部門排障行為復(fù)雜,需較長(zhǎng)時(shí)間進(jìn)行故障定位,無法達(dá)到精準(zhǔn)化報(bào)警;同時(shí)由于系統(tǒng)和應(yīng)用間交互關(guān)系復(fù)雜,往往需要多部門聯(lián)動(dòng)、多環(huán)節(jié)并發(fā)式排障,造成異常處置不及時(shí)。
    • 銀行運(yùn)維數(shù)據(jù)存儲(chǔ)分散,缺乏統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),存在數(shù)據(jù)一致性、準(zhǔn)確性、完整性不足等問題,不易管理及挖掘價(jià)值,難以評(píng)估系統(tǒng)當(dāng)前和未來對(duì)資源的需求,及資源分配的合理性。
    • 銀行數(shù)據(jù)中心的安全生產(chǎn)水平,依賴于開發(fā)、測(cè)試、運(yùn)行以及業(yè)務(wù)、風(fēng)險(xiǎn)管理、支持保障等多個(gè)部門,在實(shí)際運(yùn)維工作中,運(yùn)維職能難以清晰界定,部門間協(xié)同存在客觀難度。
    • 在銀行實(shí)際運(yùn)維工作中,部分場(chǎng)景問題解決過度依賴專家人員,解決方案沒有形成知識(shí),難以傳承復(fù)用,也無法持續(xù)擴(kuò)展打造自身知識(shí)運(yùn)營(yíng)體系。


    第3章 智和信通銀行數(shù)據(jù)中心自動(dòng)化運(yùn)維解決方案

    ? ? ? ? 銀行作為對(duì)IT系統(tǒng)可用性、業(yè)務(wù)系統(tǒng)穩(wěn)定性要求更高的金融機(jī)構(gòu),對(duì)整體網(wǎng)絡(luò)架構(gòu)的可靠性、安全性等方面提出更高要求。銀行數(shù)據(jù)中心的網(wǎng)絡(luò)運(yùn)維涉及網(wǎng)絡(luò)可視化、故障管理、性能管理、業(yè)務(wù)管理、配置管理、變更管理、應(yīng)急保障等多方面的需求。同時(shí),因業(yè)務(wù)的特殊性,客戶對(duì)銀行服務(wù)中斷和性能問題的容忍度較低,運(yùn)維需求已由單純的實(shí)現(xiàn)IT支撐,逐步轉(zhuǎn)變?yōu)橹С謽I(yè)務(wù)發(fā)展,平穩(wěn)應(yīng)對(duì)業(yè)務(wù)量持續(xù)及爆發(fā)式增長(zhǎng),保障用戶體驗(yàn)等方面的需求,因此在系統(tǒng)異構(gòu)的現(xiàn)狀下,如何保障業(yè)務(wù)連續(xù)性和高可靠性建設(shè)正在逐步成為銀行數(shù)據(jù)中心運(yùn)維的重點(diǎn)。

    ? ? ? ? 北京智和信通深入分析銀行運(yùn)維需求,針對(duì)銀行數(shù)據(jù)中心基礎(chǔ)架構(gòu)復(fù)雜度不斷增長(zhǎng),服務(wù)器數(shù)量急劇增加,業(yè)務(wù)復(fù)雜度快速發(fā)展的現(xiàn)狀,提出自動(dòng)化運(yùn)維方案,為銀行網(wǎng)絡(luò)保駕護(hù)航。

    智和信通銀行網(wǎng)絡(luò)運(yùn)維平臺(tái)功能模型

    3.1.異地網(wǎng)絡(luò)架構(gòu)可視化

    ? ? ? ? 目前大型銀行基本采取全國(guó)數(shù)據(jù)集中管理的模式,在網(wǎng)絡(luò)架構(gòu)上采用“全國(guó)一網(wǎng)”的形式。網(wǎng)絡(luò)架構(gòu)中軟硬件環(huán)境涉及的技術(shù)復(fù)雜,廠商眾多。北京智和信通通過網(wǎng)絡(luò)架構(gòu)拓?fù)淇梢暬芰Γ瑢⒕W(wǎng)絡(luò)數(shù)據(jù)從離線表格轉(zhuǎn)移至平臺(tái)內(nèi),從靜態(tài)的網(wǎng)絡(luò)架構(gòu)數(shù)據(jù)轉(zhuǎn)化為動(dòng)態(tài)智能拓?fù)洌瑢?shí)現(xiàn)全網(wǎng)設(shè)備、資源、鏈接關(guān)系、IP等實(shí)時(shí)更新、快速定位。

    ? ? ? ? 在動(dòng)態(tài)拓?fù)渖险宫F(xiàn)設(shè)備實(shí)時(shí)狀態(tài),通過樹形、平面結(jié)構(gòu)聯(lián)動(dòng)展示設(shè)備間鏈接關(guān)系,通過按片區(qū)、按地域、按層級(jí)等多種布局方式劃分網(wǎng)絡(luò),使用不同顏色、粗細(xì)、圖標(biāo)表示被管理對(duì)象的狀態(tài)信息,助力運(yùn)維人員實(shí)時(shí)了解網(wǎng)絡(luò)架構(gòu)及全網(wǎng)運(yùn)行狀態(tài),快速感知資源、鏈路、流量等異常信息。

    銀行網(wǎng)絡(luò)撲示意圖

    3.2.“兩地三中心”的災(zāi)備架構(gòu)可視化

    ? ? ? ? 為滿足銀行對(duì)業(yè)務(wù)穩(wěn)定運(yùn)行與快速恢復(fù),確立“兩地三中心”的災(zāi)備模式,即數(shù)據(jù)中心、同城災(zāi)備中心和異地災(zāi)備中心,非常重要。但是異地+多中心的模式,給網(wǎng)絡(luò)可視化運(yùn)維管理帶來更大挑戰(zhàn)。

    ? ? ? ? 北京智和信通自動(dòng)化運(yùn)維方案通過多維管理視圖,對(duì)不同品牌、類型、版本的網(wǎng)絡(luò)設(shè)備、安全設(shè)備、無線設(shè)備、存儲(chǔ)、主機(jī)、中間件、數(shù)據(jù)庫(kù)、虛擬化、應(yīng)用服務(wù)、視頻監(jiān)控等IT資源進(jìn)行統(tǒng)一、全方位、多層次的綜合管理,實(shí)時(shí)分析資源當(dāng)前性能和運(yùn)行狀態(tài),直觀反映資源的動(dòng)態(tài)變化對(duì)支撐業(yè)務(wù)的影響。

    銀行網(wǎng)絡(luò)撲示意圖

    3.3.端到端全鏈路可視化

    ? ? ? ? 從整體維度到局部維度展示銀行網(wǎng)絡(luò)內(nèi)設(shè)備鏈路各項(xiàng)指標(biāo),整體可觀測(cè)、可告警、可分析、可統(tǒng)計(jì),通過實(shí)時(shí)監(jiān)控各個(gè)端口以及每條線路的通斷情況和性能指標(biāo),結(jié)合專業(yè)的流量監(jiān)控分析能力,對(duì)鏈路容量進(jìn)行即時(shí)監(jiān)控,并生成流量分析報(bào)告,為容量規(guī)劃提供依據(jù)。

    ? ? ? ? 針對(duì)銀行雙運(yùn)營(yíng)商網(wǎng)絡(luò)的模式,對(duì)雙鏈路進(jìn)行管理,通過不同顏色展示主備線路,支持自動(dòng)切換監(jiān)控線路,實(shí)現(xiàn)主線路掉線設(shè)備顯示紅色,副線路掉線設(shè)備顯示棕色,全掉線顯示灰色。

    鏈路綜合信息示意圖

    3.4.全網(wǎng)資源統(tǒng)一監(jiān)控

    ? ? ? ? 本方案實(shí)現(xiàn)網(wǎng)絡(luò)設(shè)備信息高頻采集,并結(jié)合智能算法,實(shí)現(xiàn)對(duì)整體網(wǎng)絡(luò)架構(gòu)、設(shè)備運(yùn)行狀態(tài)、業(yè)務(wù)可用狀態(tài)的實(shí)時(shí)信息采集和感知。通過對(duì)銀行網(wǎng)絡(luò)中海量設(shè)備的智能解析和關(guān)聯(lián)分析,結(jié)合全流量采集分析能力,形成整個(gè)網(wǎng)絡(luò)通信鏈路的多端網(wǎng)絡(luò)流量分析鏈,助力運(yùn)維人員從多個(gè)維度實(shí)現(xiàn)對(duì)相應(yīng)告警的智能分析,解決傳統(tǒng)運(yùn)維監(jiān)控中關(guān)聯(lián)數(shù)據(jù)缺失,輔助排障信息不足的問題。

    3.4.1.全網(wǎng)軟硬件設(shè)備統(tǒng)一監(jiān)控

    ? ? ? ? 方案針對(duì)銀行網(wǎng)絡(luò)內(nèi)各類設(shè)備、業(yè)務(wù)系統(tǒng)構(gòu)建統(tǒng)一、智能監(jiān)控體系,對(duì)業(yè)務(wù)系統(tǒng)、操作系統(tǒng)、基礎(chǔ)設(shè)施、主機(jī)存儲(chǔ)、數(shù)據(jù)庫(kù)、中間件、虛擬化、云、數(shù)據(jù)中心機(jī)房等全方位監(jiān)管。屏蔽廠商、型號(hào)差異,掌握銀行網(wǎng)絡(luò)整體運(yùn)行情況和運(yùn)行效能,能高效、快速、精準(zhǔn)進(jìn)行故障定位診斷。

    設(shè)備資源可視化顯示?

    3.4.2.全網(wǎng)帶寬、流量監(jiān)控與回溯分析

    ? ? ? ? 方案基于海量流量數(shù)據(jù)的存儲(chǔ)挖掘,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)流量的偵測(cè)分析。通過網(wǎng)絡(luò)流量分析技術(shù),采集、分析、存儲(chǔ)所有網(wǎng)絡(luò)流量,回溯分析數(shù)據(jù)包特征、異常網(wǎng)絡(luò)行為,以多維數(shù)據(jù)分析和深度挖掘?yàn)槭侄危瑢?shí)現(xiàn)數(shù)據(jù)包層面的流量追蹤,發(fā)現(xiàn)潛伏于網(wǎng)絡(luò)中的未知攻擊。

    ? ? ? ? 針對(duì)銀行中業(yè)務(wù)專線、物聯(lián)網(wǎng)專線等專線線路管理需求,通過實(shí)時(shí)監(jiān)控和定期對(duì)專線線路的使用情況進(jìn)行統(tǒng)計(jì)分析,為每條專線的擴(kuò)容或縮容提供數(shù)據(jù)依據(jù)。

    全網(wǎng)流量監(jiān)控與回溯分析示意圖

    ? ? ? ? 從設(shè)備、接口、IP、服務(wù)、應(yīng)用、會(huì)話、QoS等層級(jí)的實(shí)時(shí)流量監(jiān)控和歷史流量分析,識(shí)別帶寬消耗較大的應(yīng)用程序、服務(wù)、協(xié)議或 IP 地址,避免網(wǎng)絡(luò)容量過載,并提升更終用戶網(wǎng)絡(luò)體驗(yàn)。

    3.4.3.IP地址分配與管理

    ? ? ? ? 銀行對(duì)IP地址管理的性與安全性存在更高要求,北京智和信通自動(dòng)化運(yùn)維方案支持端到端規(guī)劃、部署、管理和監(jiān)控IP 地址。通過智能IP掃描能力,定義多層次子網(wǎng),掃描其范圍內(nèi)每個(gè)IP地址的當(dāng)前狀態(tài),包括IP地址,MAC地址等信息,也可以查看IP段內(nèi)地址使用詳情,便于銀行信息科技部進(jìn)行IP地址分配管理等。


    ? ? ? ? 通過端口視圖及列表視圖的形式,展示當(dāng)前IP地址的使用情況,可查看某個(gè)子網(wǎng)的IP現(xiàn)網(wǎng)詳情信息,如IP、掩碼、主機(jī)名、設(shè)備類型、現(xiàn)網(wǎng)MAC、現(xiàn)網(wǎng)接入設(shè)備、現(xiàn)網(wǎng)接入端口、規(guī)劃MAC、規(guī)劃接入設(shè)備、使用人等,可批量分配IP地址,保障了IP地址使用的性。


    ? ? ? ? 通過黑白名單配置,通過黑白名單功能用來檢測(cè)用戶所關(guān)心的設(shè)備是否在網(wǎng)絡(luò)中出現(xiàn)及出現(xiàn)時(shí)間,對(duì)非法接入設(shè)備進(jìn)行告警處置。支持IP-MAC綁定,對(duì)全網(wǎng)MAC和IP進(jìn)行配對(duì)綁定,并周期性對(duì)MAC-IP進(jìn)行檢測(cè),當(dāng)IP-MAC的綁定關(guān)系發(fā)生沖突時(shí)產(chǎn)生告警,保證入網(wǎng)終端安全可信。

    3.4.4.視頻設(shè)備集中監(jiān)控

    ? ? ? ? 本方案可對(duì)不同品牌、不同型號(hào)的攝像頭進(jìn)行統(tǒng)一運(yùn)維,融合網(wǎng)絡(luò)高清、智能分析、多級(jí)管控為一體。支持監(jiān)管視頻監(jiān)控體系涉及的視頻前端設(shè)備(攝像頭、卡口、編解碼器),傳輸設(shè)備(光纖收發(fā)器、EPON 等)內(nèi)場(chǎng)設(shè)備(網(wǎng)絡(luò)與安全設(shè)備、主機(jī)/虛擬機(jī)、存儲(chǔ)設(shè)備)、機(jī)房動(dòng)力環(huán)境等多種設(shè)備,等統(tǒng)一接入、集中管理。并通過網(wǎng)絡(luò)拓?fù)湟绘I自動(dòng)發(fā)現(xiàn)生成能力,直接生成視頻系統(tǒng)可視化拓?fù)?,通過定時(shí)輪詢和事件上報(bào)進(jìn)行可用性和健康度檢查。

    視頻監(jiān)控效果示意圖

    ? ? ? ? 平臺(tái)輕松對(duì)接多品牌、型號(hào)攝像頭,通過onvif接口協(xié)議和智能化識(shí)別技術(shù),實(shí)現(xiàn)對(duì)視頻畫面自動(dòng)偵測(cè)、自動(dòng)提取,主動(dòng)監(jiān)控發(fā)現(xiàn)和分析出攝像機(jī)設(shè)備常見的故障,如設(shè)備不連通、畫面偏色、信號(hào)缺失、清晰度異常、亮度異常等問題和原因,并及時(shí)在拓?fù)鋱D中顯示出當(dāng)前視頻監(jiān)控的可用情況。

    3.4.5.設(shè)備模型庫(kù)監(jiān)管無限制

    ? ? ? ? 方案采取用戶自定義設(shè)備類型及其設(shè)備資源的方式,賦予用戶自定義適配設(shè)備的能力,更大可能地支持對(duì)不同設(shè)備類型的支持。通過自定義設(shè)備類型及其設(shè)備資源,更大限度上提高了智和網(wǎng)管平臺(tái)的管理范圍,真正實(shí)現(xiàn)了對(duì)設(shè)備及其資源的化管理,達(dá)到管控萬(wàn)物的目標(biāo)。


    3.5.適配國(guó)產(chǎn)信創(chuàng)環(huán)境

    ? ? ? ? 平臺(tái)以JAVA編程語(yǔ)言為基礎(chǔ),從功能塊、數(shù)據(jù)庫(kù)、界面全部基于統(tǒng)一JAVA技術(shù)平臺(tái)和統(tǒng)一數(shù)據(jù)關(guān)系模型。

    ? ? ? ? 智和信通國(guó)產(chǎn)信創(chuàng)能力采用Java、HTML5跨平臺(tái)技術(shù),兼容國(guó)產(chǎn)化操作系統(tǒng)、數(shù)據(jù)庫(kù)、中間件、CPU和虛擬化等,支持包括:中標(biāo)麒麟、銀河麒麟、中科方德、達(dá)夢(mèng)、人大金倉(cāng)、南大通用、神州通用、華為虛擬化、H3C虛擬化、深信服虛擬化等。


    3.6.業(yè)務(wù)可用性管理

    ? ? ? ? 銀行業(yè)務(wù)系統(tǒng)流程從終端用戶側(cè)的柜面、網(wǎng)銀、手機(jī)銀行,到ESB業(yè)務(wù)系統(tǒng)總線,再到后端核心系統(tǒng),每個(gè)環(huán)節(jié)互相關(guān)聯(lián)影響。本方案以保障業(yè)務(wù)可用性為基礎(chǔ),通過對(duì)承載業(yè)務(wù)的IT基礎(chǔ)設(shè)施構(gòu)建真實(shí)的業(yè)務(wù)模型。

    銀行業(yè)務(wù)系統(tǒng)示意圖

    ? ? ? ? 方案通過構(gòu)建業(yè)務(wù)系統(tǒng)與部門、IT資源及關(guān)鍵指標(biāo)的關(guān)聯(lián)關(guān)系,整合前端、應(yīng)用、后臺(tái)任務(wù)、外部服務(wù)、數(shù)據(jù)庫(kù)及基礎(chǔ)設(shè)施,直觀呈現(xiàn)面向服務(wù)的業(yè)務(wù)系統(tǒng)體系架構(gòu);直觀、便捷地幫助運(yùn)維人員對(duì)銀行內(nèi)辦公系統(tǒng)、交易系統(tǒng)、支付系統(tǒng)、網(wǎng)銀系統(tǒng)、基金系統(tǒng)、保險(xiǎn)系統(tǒng)、官網(wǎng)、手機(jī)APP系統(tǒng)等進(jìn)行監(jiān)控,掌握業(yè)務(wù)的運(yùn)行狀態(tài)和健康水平,了解業(yè)務(wù)動(dòng)態(tài)變化趨勢(shì),快速定位故障源,降低運(yùn)營(yíng)風(fēng)險(xiǎn)。

    業(yè)務(wù)看板示意圖

    3.7.實(shí)時(shí)故障預(yù)警,及時(shí)洞察異常信息

    ? ? ? ? 北京智和信通銀行數(shù)據(jù)中心自動(dòng)運(yùn)維方案,通過統(tǒng)一的故障管理平臺(tái),將各個(gè)模塊中的監(jiān)控信息統(tǒng)一采集、分析,實(shí)現(xiàn)整個(gè)銀行網(wǎng)絡(luò)中各種事件信息、設(shè)備故障、網(wǎng)絡(luò)異常、流量異常等告警,以智能化手段進(jìn)行標(biāo)準(zhǔn)化的分析、壓縮、并歸關(guān)聯(lián)等,通過多種方式實(shí)時(shí)傳達(dá)告警信息,保證落實(shí)到指定人員進(jìn)行處理,為銀行提供主動(dòng)式的故障解決方案。

    ? ? ? ? 采集銀行內(nèi)所有聯(lián)網(wǎng)設(shè)備,如存儲(chǔ)、服務(wù)器、路由器、交換機(jī)、防火墻、虛擬化、云、自動(dòng)提款機(jī)、自動(dòng)存款機(jī)、存折補(bǔ)登機(jī)、多媒體查詢機(jī)、票據(jù)打印機(jī)、開卡機(jī)等設(shè)備、資源、應(yīng)用、服務(wù)等的狀態(tài)信息,通過對(duì)告警機(jī)制以及閾值的設(shè)置,即時(shí)獲取準(zhǔn)確的告警信息,快速定位告警設(shè)備,提升告警處理效率,降低因設(shè)備故障帶來的損失。


    3.8.全覆蓋IT資源自動(dòng)巡檢

    ? ? ? ? 傳統(tǒng)的人工巡檢,尤其是應(yīng)用巡檢,缺乏統(tǒng)一的規(guī)范、標(biāo)準(zhǔn),導(dǎo)致巡檢的范圍和深度都存在一定的局限性,并且是基于人工的手工統(tǒng)計(jì),工作效率比較低,同時(shí)耗費(fèi)較大的人力資源。

    ? ? ? ? 本方案依托平臺(tái)將以前依賴手工進(jìn)行的日常巡檢轉(zhuǎn)換為自動(dòng)化、定時(shí)執(zhí)行的巡檢策略。制定統(tǒng)一的巡檢指標(biāo)、巡檢方式、巡檢頻度等,保證巡檢標(biāo)準(zhǔn)化、巡檢范圍、巡檢深度;通過設(shè)計(jì)巡檢作業(yè)、數(shù)據(jù)采集方式、自動(dòng)化作業(yè)調(diào)度等實(shí)現(xiàn)日常巡檢的自動(dòng)化,代替手工工作,提高效率的同時(shí),解放管理人員,釋放管理人員更多的精力,使更多的精力處理更重要的事項(xiàng)。


    3.9.網(wǎng)絡(luò)變更實(shí)現(xiàn)“人工+智能”

    ? ? ? ? 銀行網(wǎng)絡(luò)對(duì)運(yùn)維的顆粒度和精細(xì)程度均有較高要求,運(yùn)維過程中網(wǎng)絡(luò)人員將面對(duì)每日數(shù)以百計(jì)的網(wǎng)絡(luò)變更及調(diào)整,相關(guān)的變更從用戶域訪問控制到變更投產(chǎn),都需要投入大量的人力進(jìn)行變更內(nèi)容的評(píng)審和準(zhǔn)備。在安全合規(guī)的前提下,將運(yùn)維人員從整體的變更流程及變更內(nèi)容的準(zhǔn)備中解脫出來,實(shí)現(xiàn)網(wǎng)絡(luò)變更、設(shè)備配置自動(dòng)化。


    3.10.人工運(yùn)維與故障自愈結(jié)合

    ? ? ? ? 通過實(shí)時(shí)發(fā)現(xiàn)告警,進(jìn)行預(yù)診斷分析,判斷告警類型和級(jí)別,如果是一般告警,平臺(tái)進(jìn)行自動(dòng)恢復(fù),如果是嚴(yán)重復(fù)雜告警則通過告警通知、運(yùn)維工單等形式通知運(yùn)維管理人員,進(jìn)行人工處理。同時(shí),將只能有專家處理的各類操作和判斷轉(zhuǎn)化為可存在于平臺(tái)內(nèi)的流程,形成可保留可復(fù)用的運(yùn)維知識(shí)。

    3.11.全場(chǎng)景實(shí)現(xiàn)自動(dòng)災(zāi)備切換

    ? ? ? ? 通過一鍵啟停的應(yīng)用控制和場(chǎng)景觸發(fā),簡(jiǎn)化人工操作,實(shí)現(xiàn)快速災(zāi)備切換。保障在遇到系統(tǒng)故障、業(yè)務(wù)崩潰等災(zāi)難時(shí),自動(dòng)將源端業(yè)務(wù)切換到備端數(shù)據(jù)中心,從而保障業(yè)務(wù)的連續(xù)性,實(shí)現(xiàn)業(yè)務(wù)的高可用。

    3.12.靈活編排,多運(yùn)維場(chǎng)景支持

    ? ? ? ? 自動(dòng)化運(yùn)維編排,可實(shí)現(xiàn)完全根據(jù)用戶場(chǎng)景,定制化設(shè)計(jì)運(yùn)維劇本,真正將運(yùn)維任務(wù)托管至平臺(tái),解放人力。

    • 開發(fā)環(huán)境自動(dòng)化,如軟件代碼自動(dòng)化更新、自動(dòng)化編譯、自動(dòng)化打包、自動(dòng)化發(fā)布預(yù)生產(chǎn)環(huán)境。
    • 應(yīng)用發(fā)布自動(dòng)化,如服務(wù)自動(dòng)化升級(jí)、軟件自動(dòng)化部署等。
    • 故障自愈能力,如網(wǎng)口異常自動(dòng)關(guān)閉、磁盤爆滿自動(dòng)清理、非法設(shè)備入侵阻斷、CPU空間不足自動(dòng)重啟等。
    • 定時(shí)服務(wù)重啟,如在工作日每天晚上定時(shí)關(guān)閉應(yīng)用,每天早上自動(dòng)重啟應(yīng)用等。
    • 智能批量設(shè)備管控,如批量設(shè)備策略執(zhí)行,當(dāng)設(shè)備的配置狀態(tài)不一時(shí),能夠基于當(dāng)前設(shè)備自身的狀態(tài)自動(dòng)決策適合于本設(shè)備的管控操作等。
    • 定期設(shè)備健康狀況自檢,如定期設(shè)備健康狀態(tài)自檢、服務(wù)運(yùn)行狀態(tài)自檢等。
    • 基于HTTP接口自動(dòng)化,如基于HTTP接口的工單自動(dòng)化、審批自動(dòng)化、業(yè)務(wù)自動(dòng)化等。
    • 高可用服務(wù)自動(dòng)切換,如主備數(shù)據(jù)庫(kù)運(yùn)行狀況自檢異常自動(dòng)切換,服務(wù)運(yùn)行狀態(tài)檢查主備切換等。
    • 虛擬化、云服務(wù)資源自動(dòng)化擴(kuò)容,如在虛擬化環(huán)境資源不足時(shí)自動(dòng)化根據(jù)實(shí)際情況進(jìn)行擴(kuò)容。
    • 日常運(yùn)維自動(dòng)化,如自動(dòng)化定期執(zhí)行批處理cmd\sh腳本、自動(dòng)化定期數(shù)據(jù)清洗、自動(dòng)化定期環(huán)境檢查并導(dǎo)出報(bào)表等。

    3.13.積累形成運(yùn)維知識(shí)庫(kù)

    ? ? ? ? 在銀行日常網(wǎng)絡(luò)運(yùn)維服務(wù)中,重復(fù)的故障和請(qǐng)求約占到70%,只有30%的故障真正需要專業(yè)人員來解決,知識(shí)經(jīng)驗(yàn)對(duì)提升重復(fù)工作的效率起到了至關(guān)重要的作用。

    ? ? ? ? 通過智和網(wǎng)管平臺(tái)自動(dòng)化運(yùn)維的能力,將只能有專家處理的各類操作和判斷轉(zhuǎn)化為可存在于平臺(tái)內(nèi)的流程,形成可保留可復(fù)用的運(yùn)維知識(shí),減少因誤操作帶來的損失,保障運(yùn)維效率。以規(guī)范的流程進(jìn)行運(yùn)維作業(yè),保障關(guān)鍵數(shù)據(jù)的完整合規(guī)。

    3.14.可視化數(shù)據(jù)分析

    ? ? ? ? 利用圖形、圖表、圖表等易于理解的形式,提取和分析大量復(fù)雜的銀行網(wǎng)絡(luò)中各類運(yùn)維數(shù)據(jù),呈現(xiàn)分析結(jié)果,從而幫助運(yùn)維人員在短時(shí)間內(nèi)更好地理解和獲得更多的信息,幫助運(yùn)維部門能夠?qū)崟r(shí)了解業(yè)務(wù)和其所依賴IT資源的運(yùn)行狀況,以及提供系統(tǒng)運(yùn)維和優(yōu)化的指示和依據(jù)。

    銀行拓?fù)浯笃潦疽鈭D

    ? ? ? ? 適配各種應(yīng)用場(chǎng)景,二十四小時(shí)不間斷監(jiān)控,細(xì)粒度可達(dá)網(wǎng)絡(luò)中每個(gè)設(shè)備、資源和鏈路。所有的網(wǎng)絡(luò)故障都一目了然地呈現(xiàn),大大降低了管理成本,同時(shí)也提高了運(yùn)維人員處理故障的能力,節(jié)省的故障處理時(shí)間,為運(yùn)維人員管理網(wǎng)絡(luò)提供了可靠的保證。

    3.15.資產(chǎn)全生命周期監(jiān)管

    ? ? ? ? 對(duì)于銀行的網(wǎng)絡(luò)資產(chǎn)管理,采取統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),對(duì)整體網(wǎng)絡(luò)資產(chǎn)進(jìn)行梳理和調(diào)用,避免資產(chǎn)信息在運(yùn)維系統(tǒng)和實(shí)物間的差異,減少網(wǎng)絡(luò)運(yùn)維過程中信息不一致、數(shù)據(jù)不統(tǒng)一等問題通過平臺(tái)將資產(chǎn)實(shí)物與運(yùn)維數(shù)據(jù)庫(kù)一一對(duì)應(yīng),解決網(wǎng)絡(luò)設(shè)備在日常運(yùn)維過程中出現(xiàn)“脫管”或“半脫管”的問題,實(shí)現(xiàn)對(duì)整體銀行網(wǎng)絡(luò)內(nèi)IP、ARP、MAC接口數(shù)據(jù),訪問控制信息,應(yīng)用系統(tǒng)信息,網(wǎng)絡(luò)地址及性能容量、設(shè)備資產(chǎn)配置容量、機(jī)房布線容量信息的集中管理。


    ? ? ? ? 建立健全資產(chǎn)臺(tái)賬,實(shí)現(xiàn)一機(jī)一檔,通過自定義多級(jí)資產(chǎn)分類,細(xì)化資產(chǎn)類別,實(shí)現(xiàn)資產(chǎn)分類管控,提高資產(chǎn)精細(xì)管理程度。從資產(chǎn)入庫(kù)、領(lǐng)用、變更、維修、調(diào)撥、到報(bào)廢處置,資產(chǎn)每一步操作均實(shí)現(xiàn)完整記錄,支持追溯,通過平臺(tái)實(shí)現(xiàn)資產(chǎn)整個(gè)生命周期的全流程閉環(huán)管理,使得IT資產(chǎn)每一次生命周期變更,都有流程可依、都有跡可循,從而實(shí)現(xiàn)IT資產(chǎn)監(jiān)管。

    3.16.定制化運(yùn)維工單體系

    ? ? ? ? 通過方案實(shí)現(xiàn)運(yùn)維工單“無紙化”,支持于設(shè)備和故障管理頁(yè)面快速創(chuàng)建工單,把控故障處理進(jìn)度,通過工單平臺(tái)簡(jiǎn)化故障處理流程,形成自動(dòng)化故障處理機(jī)制,并在每個(gè)處理流程的節(jié)點(diǎn)上責(zé)任到人,實(shí)現(xiàn)在快速響應(yīng)故障的同時(shí),實(shí)現(xiàn)兼顧運(yùn)維流程管控。

    ? ? ? ? 通過建立工單服務(wù)基準(zhǔn),預(yù)設(shè)工單在不同優(yōu)先級(jí)、不同狀態(tài)時(shí),受理人應(yīng)該響應(yīng)的時(shí)間及未響應(yīng)時(shí)的處理方式,生成工單自動(dòng)化處理規(guī)則,并以多種方式進(jìn)行通知,避免時(shí)響應(yīng)提升全流程服務(wù)管理質(zhì)量。

    3.17.多級(jí)部署適配“全國(guó)一網(wǎng)”結(jié)構(gòu)

    ? ? ? ? 在“全國(guó)一網(wǎng)”數(shù)據(jù)集中管理的背景下,一旦關(guān)鍵節(jié)點(diǎn)出現(xiàn)故障或受到攻擊,更可能引發(fā)連鎖反應(yīng),波及全行,造成區(qū)域性或全行性異常。因此銀行數(shù)據(jù)中心的運(yùn)維工作不僅要確??傊行牡纳a(chǎn)安全,更重要的是要保障各分中心、各個(gè)節(jié)點(diǎn)的安全運(yùn)行。全行執(zhí)行統(tǒng)一的運(yùn)維標(biāo)準(zhǔn)和要求,橫向到邊,縱向到底,一體化管理。

    ? ? ? ? 因此,北京智和信通為銀行采取多級(jí)運(yùn)維平臺(tái)部署方案,采用綜合-區(qū)域-設(shè)備運(yùn)維平臺(tái)-設(shè)備的結(jié)構(gòu),部署多級(jí)架構(gòu)運(yùn)維平臺(tái)方案,上級(jí)運(yùn)維平臺(tái)可以查看下級(jí)運(yùn)維平臺(tái)(包含其子集)的監(jiān)控信息,綜合運(yùn)維平臺(tái)可以管理所有設(shè)備,下級(jí)運(yùn)維平臺(tái)對(duì)本區(qū)域內(nèi)單位或本單位網(wǎng)絡(luò)進(jìn)行管理。每級(jí)運(yùn)維平臺(tái)可以單獨(dú)監(jiān)控各自的網(wǎng)絡(luò)設(shè)備,也可以由綜合運(yùn)維平臺(tái)集中管理。

    智和網(wǎng)管平臺(tái)多級(jí)部署示意圖

    ? ? ? ? 實(shí)現(xiàn)上級(jí)運(yùn)維平臺(tái)對(duì)各二級(jí)單位的網(wǎng)絡(luò)設(shè)備運(yùn)行數(shù)據(jù)的采集、管理、存儲(chǔ),集成數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)的本地存儲(chǔ),并通過安全的傳輸方式將數(shù)據(jù)上傳至綜合運(yùn)維平臺(tái)。

    部署方案優(yōu)勢(shì):

    • 對(duì)于銀行總部平臺(tái),可對(duì)接下層分行子平臺(tái),支持完整的網(wǎng)絡(luò)、設(shè)備、資源、告警、事件等數(shù)據(jù)同步
    • 對(duì)于分行子平臺(tái),可完成其下各網(wǎng)點(diǎn)、機(jī)房等的設(shè)備群交互,可具有平臺(tái)完整的監(jiān)控、管理權(quán)限。
    • 子平臺(tái)支持橫向水平擴(kuò)展,隨著項(xiàng)目規(guī)模靈活增設(shè)
    • 支持聯(lián)動(dòng)資產(chǎn)平臺(tái)、工單平臺(tái)、呼叫中心等,提供一體化運(yùn)維解決方案


    第4章 方案應(yīng)用價(jià)值

    ? ? ? ? 通過部署智信通自動(dòng)化運(yùn)維方案,將傳統(tǒng)手工繪制的網(wǎng)絡(luò)拓?fù)鋱D升級(jí)到了網(wǎng)絡(luò)拓?fù)淇梢暬?,將傳統(tǒng)表格式的網(wǎng)絡(luò)資源管理升級(jí)到了應(yīng)用級(jí)的網(wǎng)絡(luò)資源可視化,將傳統(tǒng)的網(wǎng)絡(luò)定點(diǎn)抓包分析升級(jí)到了應(yīng)用級(jí)的網(wǎng)絡(luò)流量可視化,將傳統(tǒng)的經(jīng)驗(yàn)式故障定位升級(jí)到了清單化的自動(dòng)檢查定位。實(shí)現(xiàn)“高可用、高性能、高質(zhì)量”運(yùn)維管理體系,

    ? ? ? ? 在降低故障發(fā)生概率的同時(shí),在故障發(fā)生后,“早感知、快定位、急止損、優(yōu)改進(jìn)”,降低影響范圍。不但保障網(wǎng)絡(luò)基礎(chǔ)架構(gòu)穩(wěn)定性的關(guān)鍵性能指標(biāo),而且通過運(yùn)維自動(dòng)化提升整體網(wǎng)絡(luò)團(tuán)隊(duì)的能力。

    第5章 標(biāo)桿案例

    5.1.某農(nóng)商銀行雙鏈路監(jiān)控

    ? ? ? ? 由于農(nóng)商行是移動(dòng)+電信雙線路模式,其核心是想對(duì)雙線路進(jìn)行管理,監(jiān)控各鄉(xiāng)鎮(zhèn)網(wǎng)點(diǎn)的網(wǎng)絡(luò)狀況,明確移動(dòng)和電信哪條線路出現(xiàn)問題,及時(shí)進(jìn)行處理。

    • 實(shí)現(xiàn)對(duì)市和各鄉(xiāng)鎮(zhèn)網(wǎng)點(diǎn)的監(jiān)控;
    • 實(shí)現(xiàn)每臺(tái)設(shè)備上電信與移動(dòng)雙ip監(jiān)控;
    • 實(shí)現(xiàn)對(duì)交換機(jī)的詳細(xì)管理,包括性能、故障等;
    • 將拓?fù)浣缑嫱队暗酱笃聊簧线M(jìn)行展示。

    需求實(shí)現(xiàn)

    ? ? ? ? 智和信通提出了智和網(wǎng)管平臺(tái)+定制開發(fā)的方案,基礎(chǔ)需求采用智和網(wǎng)管平臺(tái)成熟功能,并針對(duì)農(nóng)商行雙線路的情況進(jìn)行部分開發(fā)。

    • 通過開發(fā),實(shí)現(xiàn)雙線路監(jiān)控,實(shí)現(xiàn)自動(dòng)切換監(jiān)控IP;
    • 由于農(nóng)商行的網(wǎng)點(diǎn)型網(wǎng)絡(luò)結(jié)構(gòu),設(shè)計(jì)通過設(shè)備顏色對(duì)雙線路進(jìn)行展示,主線路掉線設(shè)備顯示紅色, 副線路掉線設(shè)備顯示棕色,全掉線顯示灰色;
    • 通過自動(dòng)切換監(jiān)視IP,實(shí)現(xiàn)對(duì)設(shè)備不間斷的故障、性能等監(jiān)控。