系规论文范文:论IT服务风险管理

【摘要】

2019年1月,本人有幸作为系统规划和管理师负责管理某高速公路单位的收费系统运维服务项目,负责该项目运维服务的规划设计、部署实施、全周期运维服务等工作。该项目总合同额180万,服务年限为1年,为该高速公路路段的收费系统提供标准化运维服务,以确保该系统的连续性和可用性,保障高速公路收费工作的正常开展。在整个项目服务生命周期中,本人运用科学的风险管理理论知识,结合自己的项目实践经验,将风险管理当作一项重点的工作来抓,依照风险管理计划编制、风险识别、定性和定量风险分析、风险应对计划编制、风险监控和跟踪等过程,全面展开对风险的管控,最大限度地减少了IT运维服务风险的发生,运维周期结束时顺利完成SLA规定的指标,得到了甲方的好评。(307)

【正文】

2019年1月,本人以系统管理规划师的身份担任某高速公路单位的收费系统运维服务项目的项目经理。该项目年度合同额为180万元,维护对象包括机房动环、数据中心的服务器和网络设施、ETC门架收费系统、收费站和收费车道的硬件设施、监控设施、收费软件、报表软件、网络安全态势感知系统,提供日常巡检、定期检测、定期保洁保养、故障处理、设备维修和数据运维等服务。该项目收费系统主要是为高速公路收费业务服务,对其可用性、连续性要求比较高,一旦出现中断或故障,将对收费工作、社会车辆通行造成重大影响。根据SLA合同的要求,我运维项目部以驻场运维的模式为客户提供现场服务,提供每天一次的全线设备运行状况、软件运行状态的巡检工作,每季度一次对重点设备的关键指标进行检测,每季度一次对所有设备进行保洁保养。要求设备的可用率达到98%,故障修复及时率95%,一级故障要求1小时响应、提供紧急替代设备2小时恢复功能、4小时修复,二级故障要求4小时响应、48小时修复,三级故障要求12小时响应、7天内修复。为了完成上述SLA目标,我充分重视了风险管理,按照风险管理理论,通过计划编制、风险识别、风险分析、风险应对、风险监控、风险跟踪等方法,有条不紊地对IT服务全过程各阶段进行管控。具体来说,我是按照以下基本的管理过程来进行风险管理的。(535)

一、风险管理计划编制

在本项目启动前,我组织有关人员编制了风险管理计划,作为该项目处理风险管理的行动指南。本项目采用了会议形式来制订风险管理计划,参加会议的人员包括甲方分管副总、甲方IT系统管理部门的代表和我项目的相关人员。会上大家根据服务范围说明书、服务预算、进度计划等制订本项目的风险管理计划,该计划主要描述了实施风险管理的办法和工具,定义了风险管理团队的成员并分配了具体的任务,评估了风险管理所需的资源和预算,制订了风险管理过程的执行时间表,列出常用的风险,分析发生概率和影响力严重程度,最后确定了风险报告的格式和跟踪过程管理,并将其作为项目管理计划的组成部分,对风险的管理费用也一并纳入项目预算内。

二、风险识别

风险识别主要是识别IT服务的潜在风险,以及引起风险的主要因素和可能的后果。本项目中,我组织甲方主管部门的相关人员,根据评审通过的风险管理计划,结合本项目的SLA和范围说明书,以及以往的经验教训,采用头脑风暴法和SWOT分析法,形成了风险清单。本项目因为在高速公路管理中心驻地运维,离市区较远,根据以往经验,人员方面主要有连续性风险;因为需要监测的设备种类多,资源要素方面的风险主要是监测工具的准确性和稳定性风险。收费系统中,收费软件维护的专业性要求较高,存在人员能力的风险和知识转移的风险,另外还有网络安全风险、执行外场设备维修时的人身安全风险等大小20多种风险。

三、风险定性分析

对风险清单中列明的所有风险评估发生概率和影响,然后再根据风险对本项目IT服务的成本、修复及时率、设备可用率等关键指标的影响进行排序。本项目中,我邀请高速公路系统专家库的成员和我公司资深运维工程师共同对风险清单进行分析,得出的风险分析结果权威性和可行性都很高。高级别风险主要有以下几条:

1、ETC门架系统监测工具失效风险:ETC门架收费设施关系到车辆通行收费的收取,是甲方的主营业务收入来源,要求部署在门架系统上的监控工具有很高的稳定性和准确性,如监测工具失效,无法第一时间发现门架设施故障,给业务收入带来损失。

2、人员的连续性风险:在高速公路路段驻地服务,远离市区,人员流失较严重,是经常发生的风险类型。

四、风险定量分析

风险定量分析指定量地分析风险对目标的影响,面对很多不确定因素时提供了一种量化的方法,以做出尽可能恰当的决策。我组织高速公路系统内专家和资深运维工程师对本项目定量分析的结果列出了各种风险的可能性分析和量化风险的优先级列表,对风险结果中的趋势进行量化。

五、风险处置计划编制

通过对风险的分析,根据风险的优先级等制订了风险处置计划。在该计划中,充分考虑了以下几个因素:风险级别、所需处置成本、处置的及时性要求、处理结果是否可以被项目干系人所接受,并为每一个风险指定了相关的责任人以及应采取的风险处置措施。
对于风险清单中所列的高级别风险,我们制定的处置策略取得了甲方公司分管收费的总经理的认同与支持。主要应对策略如下:

1、对于ETC门架监测工具失效问题,增加了巡检频次,常规设备一天一次的巡检要求,ETC门架设备要求一天早、中、晚三次巡检;增加了收费流水数据库后校验监测措施,编写数据库脚本定时监测每一个门架的收费流水上传情况,如发现异常的流水间隔时间,马上通知设备维护人员进行确认、处理。

2、对于人员稳定性问题,在项目人员挑选上也采取了一定的措施。如调配老家在项目驻地附近的员工到本项目,优先抽调未婚青年进行驻场维护,并额外增加高速公路驻地补贴,以保持内部人员的相对稳定。

六、风险监控

在整个IT服务生命周期中,内部和外部的环境的变化,记录在风险应对计划中的风险优先级、发生的概率、影响的范围等都可能出现变化,另外还可能出现一些之前没有预计到的风险,为此需要对已识别风险进行定期跟踪、监测残余的风险、识别新产生的风险,这对于保证完成IT服务目标是必不可少的。在本项目的风险管理中,以月度和季度回顾为单位,定期对风险实行评估、审计。每月的项目内部回顾例会中将风险管理作为一个议程,对风险应对措施实施的有效性以及当前风险的状态进行检查,并识别项目中可能出现的各类新的风险。在项目季度总结会中,通过《季度运营报告》来总结此阶段的风险措施的执行情况,并组织甲方相关管理人员重新评估风险,同时更新《风险管理计划》。对于在IT服务过程中新出现的风险,我组织甲方有关人员进行评审后,更新本项目风险清单中,为后续的项目制定风险管理计划提供依据。

七、风险跟踪

风险跟踪包括已识别风险和其他突发风险的观察记录,对风险的发展状况进行记录和跟踪。在本项目,我要求风险管理员对关键设备进行指标分析比对,例如ETC门架收费成功率趋势分析、流水滞留情况分析等,采取偏差分析法,定期与IT服务规划进行比对,分析时间、成本、SLA指标等方面存在的差异,及时报告风险的管理情况,定期维护和更新风险清单,提高整个团队对风险的警惕。

【结尾】

总之,风险管理是IT服务监督管理中的一项重要活动和过程,通过有效和科学的风险管理,可以最大限度减小IT服务风险的发生,提高服务成功的概率。本年度高速公路信息化系统运维项目在2019年底顺利通过验收、结算。一年以来,顺利完成了SLA规定的各项服务指标,完成了所有突发事件、特殊事件的处理,整个系统全年可用率为99%,故障修复及时率达96%,有效地保证了高速公路收费工作的开展,得到客户方基层管理人员和高层领导的高度认可,我本人也被甲方评为本年度优秀项目经理。这得益于我重视服务过程的风险管理工作,将风险管理贯彻到运维服务的每一个阶段、每一个环节。

—— 完 ——
相关推荐
评论

立 为 非 似

中 谁 昨 此

宵 风 夜 星

。 露 , 辰

文章点击榜

细 无 轻 自

如 边 似 在

愁 丝 梦 飞

。 雨 , 花