it運維管理論文
it運維管理論文
IT運維管理作為企業信息化管理的重要組成部分,有效保障了企業業務的正常運行。這是學習啦小編為大家整理的it運維管理論文,僅供參考!
it運維管理論文篇一
IT的運維管理與實現
摘 要:在科技不斷發展和信息技術日新月異的當今社會,人們的日常工作對信息系統的以來越來越大,因此,整個信息設備的穩定運行以及日常的維護工作就顯得尤為重要。本文以ITIL理論為基礎對當今社會的IT的運維管理與實現做了深入的探討。文章開頭簡單介紹了IT在國際以及我國的發展歷程,并就ITIL作了詳細的概述;其次,通過對IT運維管理系統流程與運維管理以及資源管理和服務臺與服務臺各功能的實現來論述了整個IT運維管理系統的設計與實現過程。文章最后對本文進行了細致的總結,并就未來IT的運維管理的發展做了展望。
關鍵詞:IT運維管理;穩定運行;維護工作;設計與實現
中圖分類號:TP311.52
20世紀90年代以來,隨著英國政府電信管理中心及其下屬的中央計算機研發中心對IT服務管理實踐指南,即ITI信息技術基礎設施庫的正式發布,IT服務的質量由此開始有了一個質的飛躍。自此,作為IT管理模型的杰出代表,ITIL技術被廣泛采用,在很大程度上發揮了現代信息化資源的優勢。隨著近些年IT業的不斷地快速發展和市場應用信息化處理技術的發展日趨成熟,IT管理系統在整個部門工作中的地位顯得越來越突出。當前形勢下我國國內的IT運行管理體系仍舊以分散管理為主流系統,隨著我國經濟的不斷壯大與發展,傳統的IT運維管理已經不能滿足這種高工作量的工作,各單位內部事物的工作效率成為了高層管理著很傷腦筋的難題;由于現在國內對于IT運維管理要求的不斷提高,使得上述問題日益突出,對于運行維護部門而言要求資源進行支持的加強化已成為必然;因此,為了保證當今形勢下我國網絡的穩定性和安全性,對于整個IT行業的運維管理就必須改變以往的分散式管理運維制度,進行強化集中管理,加強以ITIL為主導的新一代運維系統的建設工作。以前,信息部門在處理相關故障方面并沒有一個統一規范的處理標準和處理步驟,同時也缺少對出現的相關的問題的記錄工作。自從基于ITIL為理論基礎的新型IT服務管理平臺投入運行之后,通過對整個發生的事件管理和配置管理兩個主要流程的記錄與處理,實現了整個IT運維管理的流程化和標準化的處理過程后,企業員工可以很方便的通過多種途徑對IT中出現的各種故障報告或者提出與之對應的服務請求。
1 ITIL簡介
作為IT服務管理的核心框架,ITIL是一套能夠協同整個運維流程通過服務級別協議(sLA)來提高IT服務質量的一種新型理論。它融合了系統管理、網絡監測以及系統開發管理等現代管理活動,以及對信息變更處理、資產管理和問題管理等許多流程理論與實踐的IT服務管理理論;整個IT管理主要分為兩大部分,即服務支持和服務提供;ITIL把整個IT管理活動歸納為一項管理功能和十個核心流程的處理工作;IT服務支持和服務提供又各包含五個流程,主要有事件管理和問題管理等環節;通過介紹我們不難發現,ITIL是通過對整個IT運維服務中的服務支持來進行事件管理的,事件管理對整個IT服務中遇到的故障能夠做出應急處理,通過對管理方法的變更、發布和配置管理來保障整個IT處理過程的記錄和管理工作的順利進行,從而達到對整個服務系統影最小化的目的。ITIL的根本目的就是為改善一系列IT服務質量不佳的狀況而不懈的努力。在整個IT處理的業務流程的改進過程中,ITIL能夠支持包括對現代企業組織機構不同形式和不同構成要素工作的全面支持與處理工作。并且可以做到根據機構、部門、工作組、所處崗位對不同人員進行靈活的模式分工。
2 IT運維管理系統的設計與實現
2.1 IT運維管理系統流程與運維管理
為了適應不同運維環境的需求,IT運維管理系統就應該對事件故障的發生以及相應流程標準處理機制全面考慮。使系統能夠根據使用者的需求功能(問題管理、事件管理以及發布管理等)進行高效的管理與預處理工作。所謂問題管理簡而言之就是當整個設計運維管理系統自動發現機制中,一旦出現故障信息,能夠迅速的以IT系統維護的關系作為依據對整個IT信息進行自動篩選并且發送給相關的運維管理人員,系統將收集到的信息進一步向系統工作臺進行轉發,以提醒相關人員對故障進行進一步的處理工作。事件管理,顧名思義,就是對已經產生的事件進行篩選,然后判斷是有相應的錯誤存在;一般而言,在具體條件下系統對做出處理反饋或者交由相關工作人員進行處理的事件有一定的記憶能力,這對于系統能夠最在有效的條件下解決故障事件的能力有了更好地保障。當前,隨著網絡協議發展的日趨成熟,整個計算機服務管理系統的資源模塊的不斷升級,以TELNET、SSH、SNMP等多個協議為代表的新型資源管理模塊能夠完成對信息的自動提取、發現設備故障和對設備故障進行監控等任務;一旦設備出現故障,運維管理人員處就能夠對故障進行及時有效的處理,在運維管理模塊給出故障分析的具體位置并就故障進行處理的過程。另外,為確保整個系統的的正常運行,運維管理模塊在對相關事件日常管理的基礎上還增加了專門針對于日常運維管理機制的設計工作,在各個配置模塊上添加了日常任務管理的功能,保證了每天系統對全套設備進行安全檢查的質量與效率。
2.2 資源管理
作為整個IT運維管理系統的基礎,資源管理系統能夠實現對全套系統的所有資源進行清楚的記錄并且有效地對管理效率有所提升,當前資源管理手段還是主要建立在對相應資源的電子或者紙質文檔的管理上,但是這種傳統的資源管理模式一旦出現資源的種類以及數量稍有增減的現象,便會使整個資源管理的工作變得十分繁復。因此在整套運維管理系統平臺中,運維管理人員須首先對各種資源進行分類,然后按照固定的格式和要求完成對各類資源相關信息的錄人工作,最后還要對整個管理流程配置自動監管設備,以保障在故障產生時系統能自動進行提醒。
2.3 服務臺與服務臺各功能的實現
服務臺是客戶向系統提交相關操作請求的一個窗口,而作為客戶提供的服務請求,說白了其實就是業務部門與整個信息中心之間進行信息交流的一個接口,但這個接口特殊是因為它具有唯一性。因為整個來自服務臺業務的客戶投訴和服務臺系統的監控系統發出的告警信息都是通過這個借口來傳遞的。服務臺業務流程是:根據客戶投訴或者監控系統發出的告警填寫服務請求工單,服務臺值班人員根據請求的嚴重程度判斷是否需要馬上處理或者現場處理,如果需要直接進入事件管理流程的入口(升級為事件);如不需要就分配給相關人員立即處理,處理完畢后填寫請求處理工單,該服務請求流程結束。
3 小結
提高整個IT運維管理部門工作效率的最為行之有效的方式就是從整個IT系統的擴展性能、實用性能和集成性能方面出發以全局的眼光來提高整套IT設備的管理從而完成以ITIL理論為基礎的全套運維管理系統的設計工作,成為當下相關信息中心研發部門進行研究和改進的重點。
參考文獻:
[1]張瑞冉.IT服務管理在運維管理中的研究與應用[D].首都經濟貿易大學2012
[2]楊小曄.IT運維管理平臺的設計與實現[D].北京郵電大學2011
[3]林碧芬.基于信息類型的信息網站設計模式研究[J].福建電腦.2009(11)
[4]李長征.國家部委IT運維管理體系案例[J].電子政務.2008(12)
作者單位:華為技術有限公司,廣東深圳 518129
it運維管理論文篇二
IT運維管理的自動化的研究
摘要:隨著信息時代的持續發展,IT運維已經成為IT服務內涵中重要的組成部分。IT運維從誕生發展至今,自動化作為其重要屬性之一已經不僅僅只是代替人工操作,更重要的是深層探知和全局分析,關注的是在當前條件下如
何實現性能與服務最優化,同時保障投資收益最大化。
關鍵詞:IT運維管理 自動化 路徑
IT運維管理自動化是指通過將IT運維日常的、大量的重復性工作自動化,把過去的手工執行轉為自動化操作,使IT運維工作得到升華。IT運維自動化不單純只是一個維護過程,同時更是一個管理的過程,一個能夠主動診斷和維修終端系統并能快速簡便更新補丁程序的自動化運維平臺顯然是IT工作雇員的愿望。因此,實現IT運維管理自動化是從傳統被動式服務轉變為主動預防式服務,以完善的流程程序貫穿整個運維管理的過程,實現運維管理的標準化、規范化、流程化和自動化是目前企業信息化建設急需解決的問題。
根據調查顯示,當IT專業人員被問及他們在系統管理面臨的最大的挑戰時 ,近一半的受訪者(46%)選擇了“提供對終端用戶滿意的服務水平”。這個看似最為基本的要求反而成為IT專業人員最大的難題。顯然,保持應用程序和系統啟動并運行并不像聽起來那般容易,這就更有理由讓公司考慮自動化作為一個有效的解決方案來設置和維護最高級服務水平。
具體來說,一個企業往往擁有許多IT資源來維持其系統充分運轉,通常有很多機位在管理,甚至處于不同的地理位置,且IT工作人員由于平時工作繁忙,每天都在重復著做著同一件事以至于讓IT運維管理工作陷入被動化“救火式”狀態,從而造成IT運維管理人員往往要等到事情發生才會想起來去解救,沒有流程設置,周而復始就形成了連鎖的惡性循環反應。如果能通過有限的IT人員和預算保持這一切安全運行且效率最好,這便是自動化的效果。
一、 緒論
1、 IT運維管理自動化研究的背景
新世紀的到來,也給各個行業帶來了新的挑戰和機遇。伴隨著信息化的不斷深入,企業數據量呈指數倍上升趨勢。IT運維管理也逐漸出現了一些瓶頸。一方面數據中心集中了幾乎所有的應用和系統,技術復雜度和關聯度已經不能和以前相比;另一方面運維人員的高度集中和專業化也帶來了IT運維管理的高度復雜性。
雖然這些年在安全設備的應用上越來越多,安全手段的采用也越來越多,但安全狀況卻不見好轉。一些IT管理人員經常納悶:我們已經在安全方面投入了相當多的努力,但為什么還會不時的出現安全問題?面對眾多的設備與手段,IT運維人員有時候感到無所適從,其根源又是什么呢?IT運維自動化的下一步該怎么走?接下來,我們將在本文中詳細介紹解決這些問題的辦法。
2、我國當前IT運維管理自動化的發展現狀
我國企業的IT運維管理大部分停留在IT運維管理軟件的應用深化,管理流程的制定、梳理和優化,管理制度的完善階段。但企業在實施信息化決策時,忽視了對內部業務流程和信息技術的管理變革。
運維管理部門平常的工作就像是“救火隊”。IT人員總是隨時緊張的待命,以便應付計算機系統各種各樣的需求,即使這樣,運維部門的服務質量和維護成本還是存在很多問題。我們需要將這些被動的管理轉化為監控管理的主動改造。
目前很多企業已經接受了它的核心戰略必須支持企業。IT部門在現在的在企業中發揮著越來越重要的作用,企業的高管也慢慢的發現,IT不再是我們所謂的“支持者”而是一個“驅動程序”。與國外尤其是歐洲的發展比較,我國的IT服務管理還處于早期的發展階段。
歐洲眾多成功企業大量的實踐證明,企業在實施IT運維管理的自動化后,減少了重復和多余的工作,有效的利用了人文資源;增強了IT人員的素質,提高員工的服務能力和工作效率;使得IT部門的服務水平規范,使工作流程規范,使得通過人事變動的風險變低;提高IT服務的可用性、可靠性和安全性,為企業用戶提供高質量的服務;IT部門的開支的有效控制,降低運營成本,降低經營風險;使得在公司的投資回報率能總體增長,給企業帶來巨大的經濟利益,使得企業的綜合競爭力提高。美國寶潔公司從1997年開始使用IT運維管理的自動化的IT服務管理體系,在接下來的四年里節省了超過約5億美元的預算,其運行費用下降了6%-8%,同時減少技術人員的數量大約在15%-20%。大量的實施服務管理的成功實踐案例,可以提高企業的運作效率的25.3%。
3、IT運維管理自動化的研究意義
企業需要建立完善而成熟的IT運維管理自動化體制,通過流程管理,不斷提高IT運維質量,實現高效運維,提升組織內IT服務滿意度。IT運維自動化是基于流程化的框架,將事件與IT流程相關聯,—旦被監控系統發現性能超標,會觸發相關事件以及事先定義好的流程,可自動啟動故障響應和恢復機制。自動化工作平臺還可幫助IT運維人員完成日常的重復性工作(如備份、殺毒等),提高IT運維效率。同時,IT運維的自動化還要求能夠預測故障、在故障發生前能夠報警,讓IT運維人員把故障消除在發生前,將所產生損失減到最低。
4、IT運維管理自動化現狀存在的問題
目前許多企業的IT運維已經實現從人工運維到計算機管理,但在交流中發現其中很多企業的IT運維管理還只是處在“半自動化”的狀態。因為這種IT運維仍然是等到IT故障出現后再由運維人員采取相應的補救措施。這些傳統的被動、孤立、半自動式的IT運維管理模式經常讓IT部門疲憊不堪,主要表現在以下三個方面:
(1)運維人員被動、效率低
在IT運維過程中,只有當事件已經發生并已造成業務影響時才能發現并著手處理,這種被動“救火”不但使IT運維人員終日忙碌,也使IT運維本身質量很難提高,導致IT部門和業務部門對IT運維的服務滿意度都不高。目前大多數企業的IT運維人員日常大部分時間和精力是處理一些簡單重復的問題,而且由于故障預警機制不完善,往往是故障發生后或報警后才會進行處理,使到IT運維人員的工作經常是處于被動“救火”的狀態,不但事倍功半而且常常會出現惡性連鎖反應。 (2)缺乏一套高效的IT運維機制
目前許多企業在IT運維管理過程中自動化的運維管理模式不足,也沒有明確的角色定義和責任劃分,使到問題出現后很難快速、準確地找到根本原因,無法及時地找到相應的人員進行處理和修復,或者是在處理過程中存在問題,缺乏發現故障的流程化,而在解決問題時不但缺乏標準化的解決方案,也缺乏一個完整的跟蹤記錄。
(3)缺乏高效的IT運維技術工具
隨著信息化的深入,企業IT系統日趨復雜,林林總總的網絡設備、服務器、中間件、業務系統等讓IT運維人員難以從容應對,即使加班加點地維護、部署、管理也經常會因設備出現故障而導致業務的中斷,嚴重影響企業的正常運轉。出現這些問題部分原因是企業缺乏事件的監控和診斷工具等IT運維技術工具,因為在沒有高效的技術工具的支持下故障事件很難得到主動、快速的處理。
二、IT運維管理自動化的系統總體設計
IT運維管理自動化系統的主要功能包括數據的采集、數據展示和運維告警。本節我們將從這三個方向出發,來介紹這三種技術。
1. 需求分析
軟件需求分析在整個軟件開發與維護過程中越來越重要,直接關系到軟件的成功與否。其主要目的是:在綜合分析用戶對系統提出的一組需求(功能、性能、數據等方面)的基礎上,構造一個從抽象到具體的邏輯模型表達軟件將要實現的需求,為下一階段的軟件設計提供設計基礎。
2. 系統功能需求
在這里我們分別介紹三種技術,而三種技術的運用是互不可分的。
3. 數據采集
數據的采集是IT運維工作的主要根本,只有完成了數據的采集,才可以通過數據來了解企業IT系統運行的狀況,才能夠進行分析、預防故障的發生、處理故障、以及進行系統的升級、優化工作。
4、數據展示
數據采集有很多種,這里我們介紹的是RRDTOOL。RRDTOOL是指Round Robin Database工具(環狀數據庫)。Round robin是一種處理定量數據、以及當前元素指針的技術。RRD的一個目的是在一個環型數據歸檔中存儲數據。
為了大家能更直觀、更方便的理解環形數據歸檔技術,我們給出RRDTOOL簡單的數據流程圖,如圖2:
5、運維告警
隨著IT運維管理自動化的不斷深入和完善,在企業中,運維告警處于非常重要的地位。在重要信息運行的過程中,能快速、及時、準確的反映問題信息,使我們能在最短的時間內處理、解決問題,從而避免巨大的損失,把損失降到最小。通過運維告警管理能降低IT管理人員的管理被動性,將管理人員從企業內部的計算機面前解放出來,真正實現無人值守的運維管理,從而節省很多開支。
在接下里來的文章里我們將介紹NAGIOS的運維告警服務。為了更直觀的了解IT運維告警的運行,我們給出其流程圖。
運維告警流程圖如圖3:
三、工作展望
隨著社會的進步與發展,有越來越多的中小企業逐漸壯大,也有越來越多的中小企業發展起來,而IT運維管理的自動化還需要進一步的發展,緊隨企業的需求,隨著信息量的加大,對IT運維管理的自動化的要求也越來越高。希望在以后的,能有一款更好的軟件,包含各種功能,能處理更多的數據,為中小企業提供便利。為提高IT運維處理問題的效率和服務質量,建設IT運維呼叫中心也是很有必要的,實現語音呼叫和業務數據的對接,配合IT運維管理系統使用。使IT運維管理的自動化發展的更完善!
參考文獻:
[1]Jan van Bon,章斌譯.基于工TIL的全球最佳實踐.IT服務管理,清華大學出版社,2006.1.
[2]左天祖.中國IT服務市場現狀與發展趨勢. 2010.1.
[3]概念、理解與實施.IT服務管理, 2008:9~10.
[4]ITIL Glossary of Terms and Definitions,2007.5.
[5]陳宏峰,劉顧. ITIL Version3理論與應用白皮書,2010.7:8~14.
作者簡介:
郭明巖,男,1985年8月,湖北工業大學計算機學院在職研究生,研究方向:計算機網絡。