? ? ? ? 當前,云計算、大數(shù)據(jù)、人工智能等IT技術迅猛發(fā)展,企業(yè)的信息化步入了一個嶄新的時代,企業(yè)規(guī)模不斷壯大,業(yè)務不斷拓展,企業(yè)信息化依賴的網(wǎng)絡結構和IT技術越來越復雜。企業(yè)運維部門采用的運維工具和技術實力直接決定企業(yè)是否能提供穩(wěn)定、可靠、快速、優(yōu)質的服務。但傳統(tǒng)網(wǎng)管監(jiān)控設備種類受限,監(jiān)控的效率不高,后期擴展困難,同時無法和企業(yè)的業(yè)務情況結合起來,無法提供足夠的安全管控功能,致使企業(yè)IT系統(tǒng)運行維護的管理水平相對滯后。
? ? ? ? 隨著企業(yè)數(shù)字化轉型升級進程的加快,很多大型集團企業(yè)的信息化建設雖已具備良好的IT基礎,但同時也導致企業(yè)IT系統(tǒng)架構越來越復雜,新業(yè)務系統(tǒng)不斷上線,企業(yè)內部難以掌握企業(yè)內所有軟硬資源的數(shù)量、版本、運行狀態(tài)等信息,大型集團企業(yè)運維面臨諸多難題。
面臨的具體難題如下:
? ? ? ? 根據(jù)企業(yè)信息化建設現(xiàn)狀和運維難題,往往提出以下基礎運維需求,并希望通過一款產品全棧式運維,滿足企業(yè)基本需求和支撐企業(yè)進行運維擴張。
(1)深入地監(jiān)控管理
? ? ? ? 企業(yè)既有不同廠商的網(wǎng)絡設備,也有各種服務器、軟件應用,設備種類繁多,設備數(shù)量巨大,而且設備的管理協(xié)議不同,運維部門期望能用一套軟件統(tǒng)一監(jiān)控起來。
(2)不間斷地全程監(jiān)控
? ? ? ? 運維部門需要進行7*24的全程監(jiān)控,故障將要發(fā)生前能提前預警,故障出現(xiàn)時可以立刻通知到管理員,定位到故障環(huán)節(jié),快速恢復系統(tǒng)。
(3)后期擴展設備的支持
? ? ? ? 對企業(yè)來說,新的業(yè)務在不斷開展,設備和新的軟件應用也在不斷擴展,運維部門期望現(xiàn)有的網(wǎng)管軟件對未來的擴展也能有較好的支持。
(4)清楚地掌控設備部署間的關系
? ? ? ? 設備之間的物理關系、設備與業(yè)務的關系,是運維部門進行全局掌控的基本條件, 隨著時間的變化、人員的流動、設備的變更、業(yè)務的遷移,導致設備和業(yè)務的拓撲關系很難管理。
(5)IT復雜性與管理方便性的矛盾
? ? ? ? IT基礎設施本身就越來越復雜,技術也越來越,面對復雜的IT設施進行管理,對運維部門技能的要求也將更高。因此對網(wǎng)管的功能要求也是越來越高,造成網(wǎng)管軟件功能操作復雜,難以上手。
(6)多層次的安全管理
? ? ? ? 對于企業(yè)中的不同部門,需要對不同的部門分配不同的管理權限以及設備權限,權限的管理分配是運維部門關注的重要指標。
(7)結合業(yè)務監(jiān)控
? ? ? ? 傳統(tǒng)網(wǎng)管監(jiān)控軟件往往只監(jiān)控網(wǎng)絡設備,無法對公司業(yè)務情況進行多層級業(yè)務可視化展示和實時監(jiān)控,難以有效反饋業(yè)務運行情況,因此需要一款產品可深入業(yè)務進行實時監(jiān)控。
(8)成本的控制
? ? ? ? 運維部門作為服務中心,如何保障IT投資收益,提升IT投資價值,實現(xiàn)更大的業(yè)務目標,是運維部門重點關注的指標。
? ? ? ? 大型集團企業(yè)中,旗下各分子公司通常分別建設數(shù)據(jù)中心和運維體系,但隨著集團信息化建設的發(fā)展,運維需求越來越多樣,各分子公司獨立建設運維系統(tǒng)的技術和成本飛速增長,且各級公司“煙囪式”分散部署的運維系統(tǒng),難以實現(xiàn)一體化管理與協(xié)同融合。北京智和信通一體化運維監(jiān)控方案,引入萬物互聯(lián)理念和技術打造一體化運維系統(tǒng),為企業(yè)信息化、數(shù)字化轉型奠定基礎。
? ? ? ? 方案通過智和網(wǎng)管平臺對管理區(qū)域內的各類網(wǎng)絡設備進行集中監(jiān)控、操作維護和資源配置調度等,實現(xiàn)對網(wǎng)絡資源的管理、運行監(jiān)測、策略配置、故障管理,并通過自動化運維能力實現(xiàn)故障資源,對于無法自愈的故障與報修,通過運維工單調動現(xiàn)場運維人員進行處理,提高企業(yè)IT設備資源的可靠性與安全性,保障企業(yè)業(yè)務穩(wěn)定運行,為用戶帶來更高質量的信息服務。
智和信通大型集團企業(yè)一體化運維監(jiān)控架構
3.1.多級架構一體化監(jiān)控
? ? ? ? 一般大型集團企業(yè)會根據(jù)地域、業(yè)務等設立多個分子公司、事業(yè)部或辦事處,如何建立“一體化”“集中式”的IT運維體系,保障集團核心網(wǎng)絡、業(yè)務的持續(xù)穩(wěn)定,降低故障率是每個大型集團企業(yè)必須思考的問題。
? ? ? ? 在運維管理上,北京智和信通一體化運維監(jiān)控方案將大型集團企業(yè)網(wǎng)絡中的IT設施均納入智和網(wǎng)管平臺中一站管控,避免分散管理,減少運維成本。采取智能技術,實現(xiàn)網(wǎng)絡拓撲可視化的能力,通過動態(tài)智能拓撲實現(xiàn)全網(wǎng)設備、資源、鏈接關系、IP等實時更新、快速定位。
? ? ? ? 通過按片區(qū)、按地域、按層級等多種布局方式劃分網(wǎng)絡,使用不同顏色、粗細、圖標表示被管理對象的狀態(tài)信息,助力運維人員實時了解網(wǎng)絡架構及全網(wǎng)運行狀態(tài),快速感知資源、鏈路、流量等異常信息。
3.2.全網(wǎng)資源統(tǒng)一監(jiān)控
? ? ? ? 通過對大型集團企業(yè)網(wǎng)絡中海量交換機、路由器、接入設備、無線AC、AP、攝像頭、操作系統(tǒng)、應用、數(shù)據(jù)庫、虛擬化、中間件、云、存儲等智能解析和關聯(lián)分析,結合全流量采集分析能力,形成整個網(wǎng)絡通信鏈路的多端網(wǎng)絡流量分析鏈,助力運維人員從多個維度實現(xiàn)對相應告警的智能分析,解決傳統(tǒng)運維監(jiān)控中關聯(lián)數(shù)據(jù)缺失,輔助排障信息不足的問題。
3.3.虛擬化資源統(tǒng)一管理
? ? ? ? 方案支持對虛擬化環(huán)境下的虛擬機、宿主機等進行全方位運維監(jiān)控,支持Exi5、KVM、Xen、Hyper-v等,監(jiān)測指標涵蓋物理機內部虛擬化設備的電源、操作系統(tǒng)、CPU、內存、磁盤等,更大化利用計算資源,保障虛擬化平臺運行穩(wěn)定。
? ? ? ? 方案對復雜的多云異構環(huán)境、云上云下資源、信創(chuàng)云等進行管理,實現(xiàn)云下服務器、網(wǎng)絡設備、安全設備、機房、機柜、專線、配件等設施,云上各類云服務器、云磁盤等云產品以及各類 IP、NAT、DNS 等資源的真正一站式運維,并支持對納管資源的快速擴展。
3.5.端到端全鏈路可視化
? ? ? ? 方案通過對交換機光口和網(wǎng)絡接口的監(jiān)控,通過數(shù)據(jù)采集分析,實現(xiàn)對網(wǎng)絡流量和關鍵連接的預測性維護,從整體維度到局部維度展示大型集團企業(yè)網(wǎng)絡內IT設備間鏈路各項指標,整體可觀測、可告警、可分析、可統(tǒng)計。
3.6.彈性擴展,滿足網(wǎng)絡發(fā)展需求
? ? ? ? 方案支持設備及資源彈性伸縮,滿足網(wǎng)絡中設備量持續(xù)增長及更新的需求??蓪υO備類型模型進行擴展,可自定義新設備的類型、圖標、類型識別策略;可對設備資源模型進行擴展,自定義新設備類型的網(wǎng)口、指示燈、風扇、電源的圖標、識別發(fā)現(xiàn)策略;可自定義設備面板圖,以拖拽、鼠標操作完成設備面板模板的制作;支持故障和性能擴展。
? ? ? ? 采集大型集團企業(yè)網(wǎng)絡內所有聯(lián)網(wǎng)設備,如交換機、路由器、接入設備、無線AC、AP、攝像頭、操作系統(tǒng)、應用、數(shù)據(jù)庫、虛擬化、中間件、云、存儲等狀態(tài)信息,通過對告警機制以及閾值的設置,即時獲取準確的告警信息,快速定位告警設備,提升告警處理效率,降低因設備故障帶來的損失。
? ? ? ? 將事件和告警分離管理,接收設備/服務器主動發(fā)送的消息,集中處理后,及時地通知用戶,并可以通過集中的管理界面進行管理。接收設備/服務器主動發(fā)送的消息,更大地提高了管理的主動性,通過統(tǒng)一界面集中管理事件,降低了管理的難度。
? ? ? ? 傳統(tǒng)的人工巡檢,尤其是應用巡檢,缺乏統(tǒng)一的規(guī)范、標準,導致巡檢的范圍和深度都存在一定的局限性,并且是基于人工的手工統(tǒng)計,工作效率比較低,同時耗費較大的人力資源。本方案依托平臺將以前依賴手工進行的日常巡檢轉換為自動化、定時執(zhí)行的巡檢策略,日常例行巡檢、節(jié)假日和重要事件前的巡檢均可自動化執(zhí)行。
? ? ? ? 隨著大型集團企業(yè)信息化建設的加速,其業(yè)務、應用層出不窮,對網(wǎng)絡帶寬的需求越來越高。正常的業(yè)務需要良好的帶寬環(huán)境保障機制,避免被一些與業(yè)務無關的雜事干擾,影響工作效率。方案對大型集團企業(yè)流量和帶寬實時監(jiān)控,將出入雙方向流量情況可視化展現(xiàn)?;诤A苛髁繑?shù)據(jù)的存儲挖掘,統(tǒng)計分析流量峰值、谷值、流量趨勢、設備流量等數(shù)據(jù),為網(wǎng)絡流量管理提供數(shù)據(jù)支撐。
3.11.全網(wǎng)IP合規(guī)監(jiān)控
? ? ? ? 對于大型集團企業(yè)的IP資產,采取統(tǒng)一數(shù)據(jù)標準,對整體網(wǎng)絡中的IP和MAC進行梳理和管理,建立健全IP資產臺賬,端到端規(guī)劃、部署、管理和監(jiān)控IP 地址。通過智能IP掃描能力,定義多層次子網(wǎng),然后掃描其范圍內每個IP地址的當前狀態(tài),包括IP地址,MAC地址等信息,也可以查看IP段內地址使用詳情,便于IP地址分配管理等。
3.12.端到端業(yè)務運維體系
? ? ? ? 隨著業(yè)務的不斷增長,企業(yè)內部應用系統(tǒng)也越來越多,如果建設統(tǒng)一的應用維護、管理體系,將給企業(yè)運維管理帶來不小的壓力。通過搭建端到端業(yè)務監(jiān)控體系,實現(xiàn)集團業(yè)務系統(tǒng)運維管理的主動化和體系化,通過實時的監(jiān)測和分析發(fā)現(xiàn)系統(tǒng)潛在的問題和風險,實現(xiàn)主動式運維管理,保障關鍵業(yè)務穩(wěn)定運行。
? ? ? ? 針對業(yè)務應用性能與用戶體驗進行檢測分析,無需安裝插件即可提供開箱即用的主動撥測試業(yè)務監(jiān)測。從前端用戶體驗、網(wǎng)絡延遲到后端的業(yè)務服務和基礎架構,全棧溯源為用戶提供端到端的完整全鏈路數(shù)據(jù)融合和關聯(lián)分析,為用戶快速發(fā)現(xiàn)業(yè)務性能瓶頸,提升用戶體驗奠定基礎。
? ? ? ? 直觀、便捷地幫助運維人員對大型集團企業(yè)的ERP、MES、LIMS、CRM、人事管理系統(tǒng)、OA管理系統(tǒng)、項目管理系統(tǒng)、桌面安全、ITSM、數(shù)據(jù)存儲備份等進行監(jiān)控,掌握業(yè)務的運行狀態(tài)和健康水平,了解業(yè)務動態(tài)變化趨勢,快速定位故障源,降低運營風險。
? ? ? ? 大型集團企業(yè)網(wǎng)絡承載的業(yè)務經常發(fā)生變更,面對業(yè)務的變更運維工程師往往要對大量設備進行操作,此時如果依靠工程師逐一登錄設備進行命令下發(fā)、策略配置,將產生大量重復性的工作,不但導致運維效率低下,也不可避免地產生人為配置錯誤。
? ? ? ? 通過智和信通全場景自動化運維方案納入監(jiān)控的設備進行單獨、批量的配置操作,設備策略遠程配置管理,可以自動批量進行設備配置修改,并可對設備配置進行備份、對比、恢復,宕機后設備配置可快速復原,保障設備及時恢復運行,提升配置效率、質量和安全性。
? ? ? ? 通過批量作業(yè)并行處理能力,實現(xiàn)多設備并發(fā)批處理操作,將簡單的設備控制操作在大批量設備進行執(zhí)行,并對執(zhí)行過程進行監(jiān)督,對執(zhí)行結果進行檢查。在安全合規(guī)的前提下,將運維人員從整體的變更流程及變更內容的準備中解脫出來,實現(xiàn)網(wǎng)絡變更、設備配置自動化。
多類型多廠商設備支持:
? ? ? ? 針對不同類型的設備,支持進行各種控制、配置操作。
? ? ? ? 對不同廠商,如Cisco、HP、Nortel、Juniper、3Com、D-link、Foundry、Dell、Proxim、NetScreen、華為、H3C、銳捷、中興等多家廠商的網(wǎng)絡設備。
? ? ? ? 方案將大型集團企業(yè)網(wǎng)絡運維中涉及的服務、命令、操作、執(zhí)行組件化、策略化,將需要進行的運維服務、操作等以組件、策略的形式托管至平臺中進行維護和管理,通過簡單靈活地編排能力,使用者可以選擇業(yè)務場景所需的策略,通過可視化拖拽的編排方式進行組合,即可完成應用場景端到端的圖形化編排,最后以多種方式觸發(fā)執(zhí)行即可完成期望的運維變更任務,從而實現(xiàn)高效、穩(wěn)定、安全的智能運維。
? ? ? ? 將人工運維與故障自愈結合,無需針對告警進行手動處置,只需預編排告警處理流程,平臺根據(jù)場景自動觸發(fā),實現(xiàn)故障自愈。
? ? ? ? 通過實時發(fā)現(xiàn)告警,進行預診斷分析,判斷告警類型和級別,如果是一般告警,平臺進行自動恢復,如果是嚴重復雜告警則通過告警通知、運維工單等形式通知運維管理人員,進行人工處理。同時,將只能由專家處理的各類操作和判斷轉化為可存在于平臺內的流程,形成可保留可復用的運維知識。
? ? ? ? 大型集團企業(yè)網(wǎng)絡設施及各業(yè)務系統(tǒng)產生的海量數(shù)據(jù)無法得到深層次的應用,管理者決策缺乏數(shù)據(jù)依據(jù),難以參考各類網(wǎng)絡業(yè)務指標、數(shù)據(jù)等實現(xiàn)對運行態(tài)勢、隱患風險的實時掌控及運營管理。
? ? ? ? 為解決此難題,智和信通大型集團企業(yè)監(jiān)控運維方案利用圖形、圖表、圖表等易于理解的形式,提取和分析大量復雜的各類運維數(shù)據(jù),呈現(xiàn)分析結果,將全域資源融合展示。從而幫助運維人員在短時間內更好地理解和獲得更多的信息,幫助運維中心能夠實時了解業(yè)務和其所依賴IT資源的運行狀況,以及提供系統(tǒng)運維和優(yōu)化的指示和依據(jù)。
3.17.IT資產生命周期監(jiān)管
? ? ? ? 對于資產管理,采取統(tǒng)一數(shù)據(jù)標準,對整體網(wǎng)絡資產進行梳理和調用,避免資產信息在運維系統(tǒng)和實物間的差異,減少網(wǎng)絡運維過程中信息不一致、數(shù)據(jù)不統(tǒng)一等問題通過平臺將資產實物與運維數(shù)據(jù)庫一一對應,解決網(wǎng)絡設備在日常運維過程中出現(xiàn)“脫管”或“半脫管”的問題。
? ? ? ? 建立健全資產臺賬,實現(xiàn)一機一檔,通過自定義多級資產分類,細化資產類別,實現(xiàn)資產分類管控,提高資產精細管理程度。從資產入庫、領用、變更、維修、調撥、到報廢處置,資產每一步操作均實現(xiàn)完整記錄,支持追溯,通過平臺實現(xiàn)資產整個生命周期的全流程閉環(huán)管理。
? ? ? ? 通過方案實現(xiàn)運維工單“無紙化”,支持于設備和故障管理頁面快速創(chuàng)建工單,把控故障處理進度,通過工單平臺簡化故障處理流程,形成自動化故障處理機制,并在每個處理流程的節(jié)點上責任到人,實現(xiàn)在快速響應故障的同時,實現(xiàn)兼顧運維流程管控。
? ? ? ? 通過建立工單服務基準,預設工單在不同優(yōu)先級、不同狀態(tài)時,受理人應該響應的時間及未響應時的處理方式,生成工單自動化處理規(guī)則,并以多種方式進行通知,避免時響應提升全流程服務管理質量。
? ? ? ? 方案涉及的所有產品與模塊,均由北京智和信通自主研發(fā),從功能模塊、數(shù)據(jù)庫、界面全部基于統(tǒng)一Java技術平臺和統(tǒng)一數(shù)據(jù)關系模型,不包含任何第三方功能庫。
? ? ? ? 智和信通提供的信創(chuàng)運維方案,立足于北京智和信通10年的國產融合經驗,與國產軟硬件產品深度適配,方案應用覆蓋各行各業(yè)。方案支持在中標麒麟、銀河麒麟、紅 旗 Linux等國產操作系統(tǒng)上運行,支持在達夢、金倉、神州等國產數(shù)據(jù)庫進行數(shù)據(jù)存儲,通過東方通等國產中間件提供對外服務,支持龍芯、申威等 國產CPU 架構,并實現(xiàn)對國產化CPU、服務器、數(shù)據(jù)庫、中間件等IT 軟硬件設備的綜合監(jiān)控與運維管理。
第5章 標桿案例-中國移動北方十三省集中監(jiān)控運維項目
? ? ? ? 2010年中國移動通信集團在全國建設了不良信息過濾系統(tǒng),此系統(tǒng)由不良信息過濾軟件、Windows 服務器、Linux 服務器、數(shù)據(jù)庫、分流設備、交換機、存儲服務器等構成。
? ? ? ? 建設范圍:中國移動不良信息過濾系統(tǒng)的北方區(qū)域:北京、天津、黑龍江、吉林、遼寧、山東、山西、甘肅、青海、西藏、河南、寧夏共13個省公司。
? ? ? ? 設備類型:過濾軟件、Windows 服務器、Linux 服務器、數(shù)據(jù)庫、分流設備、交換機、存儲服務器等
? ? ? ? 需要一套集中的OMC(操作維護中心)監(jiān)控軟件,對不良信息過濾系統(tǒng)的所有的設施進行監(jiān)控。
? ? ? ? 已實現(xiàn)包括設備拓撲、故障管理、性能管理、配置管理以及安全管理等在內的過1000種基礎網(wǎng)管功能,且支持功能擴展針對中國移動的具體需求,智和信通提出以下解決方案: