当前位置:大学毕业论文> 本科论文>材料浏览

关于运维论文范文写作 人社信息中心运维工作相关论文写作资料

主题:运维论文写作 时间:2024-01-30

人社信息中心运维工作,本论文为您写运维毕业论文范文和职称论文提供相关论文参考文献,可免费下载。

运维论文参考文献:

运维论文参考文献 小学信息技术论文德育工作论文电子信息工程毕业论文移动信息期刊

人社行业的业务包括医疗、社保、工伤、生育、就业等,与民生密切相关,其中医疗结算业务更是关系到老百姓的身体健康和生活质量.人社信息中心担负着全市医疗结算业务的核心保障职责.长期以来,医疗结算业务的运维工作,经历了几个阶段:

一、初级阶段:这个阶段,医疗相关的系统还不庞大,运维工作以人工+经验为主.出现故障时,医院会打电话过来,根据医院描述的故障现象,运维人员凭经验对故障进行判断,查找和定位故障点.这种方式对人的要求和经验依赖程度太高,并且故障的定位和解决时间过长;

二、发展阶段:在这个阶段,运维人员已经开始结合监控软件,7x24小时对设备的运行状况进行监控,并提供设备故障告警,解决了运维人员总是被动感知的问题.但随着业务系统越来越复杂,系统越来越庞大,需要监控的指标越来越多,运维人员不断增加监控项,如监控中间件、数据库等等.这又带来了新的问题:告警信息太多,误报激增,运维人员已经被这些误报淹没,不胜其烦,往往会在收到告警信息后直接关掉.而当医院真的不能刷卡时,有用的告警信息不是被忽略了,就是根本没有告警.

是继续增加监控指标,还是设置更精确的阈值降低误报率呢?这个问题摆在了运维人的面前.在解答这个问题之前,首先我们要想清楚一个问题:运维的本质是什么?

运维,本质上是一种服务,它包括三个属性:服务的对象、目标和方法.

运维服务的对象,是业务,比如人社行业的医保结算业务.

运维服务的目标,是实现业务的可控,即把业务的运行状况控制在我们能接收的范围内.再细分可以分为稳定性可控,性能可控,安全可控.比如业务中断不超过1分钟,单笔刷卡交易时长不超过5秒等等.

运维服务的方法,就是为了达到上述目标所采取的措施,监控软件就是其中之一,但目前的监控软件在设计和部署上存在一个误区:只关注基础硬件和基础软件的运行状况,不能感知业务的运行状况.举个例子,传统的监控软件可以获取系统硬件的CPU负荷、内存使用率,数据库并发数,中间件的队列等,但这些指标都不能反映业务运行状况的好坏,而运维人员比较关心的实时刷卡交易量,交易耗时,交易成功率等信息,却完全不掌握.因此,传统的监控方法,设置再多的监控指标项,告警阈值设置的再精确,也无法解决根本问题,监控的目标要回归本质.

首先,我们采取分析医保结算交易日志的方式,实现了监控医保结算交易的功能.分析日志的方式带来了2个好处:非侵入式和完全旁路监控,对业务的影响非常小.

通过分析日志获取的交易信息,我们发现这和传统的基础硬件监控相比,有很大的难度.下图是某天的医保结算业务的交易量统计图,可以看到有以下几个特点:

1.在每日的非工作时间,交易量非常少;

2.在工作时间,会有2个比较大的交易高峰,且波动较大;

3.在早8点左右,交易量会出现一个极大的增幅;

针对交易量的监控告警,就存在几个难点:

1、不同时段交易量的告警阈值如何设置?是否要针对每个时段设置不同的阈值?

2、设置告警阈值的依据是什么?传统的凭经验进行设置的方法已经完全不适用了;

经过分析研究,我们制订了医保結算交易监控的几个原则:

数据化原则:以历史数据为依据,以统计结果为准则,主观和经验为辅;

自动化原则:告警基线可自动更新,要求根据新一天的交易信息去噪点后自动更新;

可扩展原则:告警基线的计算方式,不仅能满足全市刷卡交易的监控告警需要,也要能满足某一医院、或某一区域的监控告警需要;

实用性原则:告警基线和策略的设计,要能满足几个特殊时段交易的特点:

22:00到07:00这段时间,交易量非常低,波动也小;

高峰时段,交易量大,波动也很大;

08:00前后这段时间,交易量有爆发性增长;

具体的实现办法是:

1、首先我们对历史交易数据中,同一时段的交易量、交易延时数据进行统计分析.根据统计结果,绘制散点图,得出平均值;由于根据统计学原理,同一时段的历史交易量呈正态曲线分布,且超过3个标准差的数据,出现比例低于0.3%,可以认为是噪点数据;

2、接下来,我们以平均值为基准,计算历史数据的标准差,将超过3个标准差的数据标记为噪点数据.重新计算去除噪点数据后的平均线,作为基础基线;故障时段的数据,由人工指定为噪点数据,不进入基线计算;

3、第三步,采用移动平均法对基础基线进行平滑处理,使其可以反映交易量的未来趋势,通过增加或减少n值对改变基础基线对交易变动的敏感度,如针对繁忙时段,时期n取小些,如2min,增加监测的敏感度.空闲时段,时期n取大些,如lOmin,减少监测的敏感度.

4、最后,根据前几步生成的平均线,计算预警和告警的上下限.计算原则是:超过1.5个标准差为预警线;超过2个标准差为告警线;

5、今后,通过大量的历史数据积累,这个基线计算方法可以延展出多种基线,女口.

周一~周五和周六周日采用不同的基线;

五一、十一、春节等国定假日的基线;

针对春、夏、秋、冬四季对基线进行加权修正;

6、对非工作时间的交易量监控,因为交易量太少,造成阈值不好设置.我们通过统计学的方法,分析这一时段的交易量主要在哪个区间,作为正常区间考虑,非正常区间的数据所占的百分比作为告警的依据.

举例说明:02:00到02:15这个时段,统计结果是:交易量的95%集中在5~10笔这个区间;有3%的数据低于5笔,则报警的阈值定为3%和5笔;

这一时段的告警策略就是:当出现小于5笔的次数低于3次时,只做预警,超过3次,则进行故障报警;

通过以上方式,我们很好的解决的医保结算业务的监控告警问题,运维人员在接收到告警时,可以第一时间知道业务受影响的范围,从而有针对性的采取分级响应的措施,真正做到运维服务回归本质.

结论:关于对写作运维论文范文与课题研究的大学硕士、相关本科毕业论文运维工程师培训论文开题报告范文和相关文献综述及职称论文参考文献资料下载有帮助。

电能计量采集运维工作
摘 要:电能计量运维工作是电力企业经营运行过程中不容忽视的一项工作,其工作水平影响着企业可持续运行的状况。用户电能计量方式随着科技水平以及社会的。

计量自动化系统在计量运维工作中应用
摘 要:随着用电量及用户数量的剧增,计量工作人员对电能计量装置日常检查、维护的难度不断加大;因此,在计量装置维护工作中需要利用计量自动化系统,这。

关于如何做好输电线路运维工作
摘 要:随着我国社会主义市场经济快速发展,电力系统不断升级,人们对于电力能源需求性越来越高。因此,如何加强电力输送的稳定性、不断做好输电线路运行。

基于资源视角电力企业信息系统运维风险分析
摘 要:当运维资源与风险的匹配关系和相关电力企业的现状相结合时,可以逐步搭建起电力企业的信息系统运维风险管理体制,从而使得运维风险、资源及其业务。

运维有关写作参考资料推荐
论文大全