应用正当时——浅析运维平台的构建与价值
运维平台分为五层:
1、网元层又叫被监管层,在这一层标识出运维管理平台所要监控管理的各种资源类型,资源包括视频前端设备,视频传输设备、视频平台设备以及基础IT设备等。
2、数据采集层承担对网元层各种资源的运行状态和事件数据进行抓取和采集,主要提供Agent(代理)和Agentless(无代理) 标准协议及SDK方式进行数据采集。
3、数据分析层主要是对数据采集层采集到的数据进行告警规则引擎、状态计算、定时调度、视频质量分析、根本原因分析、业务分析、事件的Flaping计算等分析处理。数据分析层负责对数据采集到的数据进行分析。包括性能状态计算,告警确认,汇总等分析处理功能。按照职责独立原则,在数据分析层划分为以下组件:
调度服务:即轮询管理服务,根据资源监控策略所设置的指标监控频度,定时的触发指标的采集调度。调度服务可以支持按秒级粒度触发调度。
规则引擎服务:定义并解析处理资源监控策略所设置的监控规则,这些规则包括频度、阈值、事件、动态基线等可以由原子规则叠加复合处理。规则引擎为调度服务、状态服务、告警服务等提供解析服务。
状态服务:当采集到指标数据后,状态服务会调用规则引擎来跟踪策略中设置的阈值,计算资源指标项当前的状态,如红(异常)、绿(正常)等。
性能分析:当指标的状态发生变化时,性能分析服务会根据策略中设置的事件规则产生性能事件。
告警服务:当有事件产生时,无论可用性、性能等事件,告警服务会根据策略中定义的告警规则来触发告警。同时推送告警到业务管理层。
关系分析:当整体业务或某视频终端产生告警时,关系分析服务可以利用资源间关联关系进行根本原因分析,准确定位视频终端告警是因为接入网络设备故障、链路故障还是因为视频服务器等故障造成。
汇总服务:汇总服务负责对采集的指标数据按照30分钟,1小时,6小时,1天等汇总频度进行计算最大值,最小值,平均值的汇总。同时把汇总数据递交到数据存储服务,进行数据持久化。
数据存储服务:数据存储服务由DB访问组件DAL完成。DAL组件内部封装了利用JDBC访问数据库的各种方法。
4、业务管理层(也叫数据业务层)将分析后的数据与各业务功能进行结合,形成各业务功能模块。运维管理平台按照功能划分为运维管理、视频诊断、运维服务。
5、应用展现层(也叫数据展现层),即用户交互UI。其具体显示媒体支持普通显示器以及大屏。展现效果可以自适应高分辨率显示。运维管理平台通过Portal门户把数据展现给用户。在展现层,设计上提供按照不同运维人员个性化进行展现。首页、报表分析、实时告警台等页面支持个性化风格定制,为领导、系统管理员、业务运维人员等不同角色设计更直观,更清晰,差异化的数据样式进行展现,这些样式包括合理的数据布局,酷炫的Flash动画效果等。
平台在实际应用中才能凸显价值。举一具体案例,新疆公安厅希望建立一种以流程为导向,以业务为中心、注重服务意识的管理模式,提高系统维护效率、减低运维成本、完善系统建设和运维历史档案管理、监督系统维护工作、评估系统运行绩效、优化系统设计和保障系统持续良好运行,来提高智能视频系统应用,加强社会面管控及维稳能力,为建设平安新疆打下坚实基础。英飞拓运维平台成功应用于新疆公安厅,并为其创造了新的服务价值,大致有五点:
其一,省厅对管辖内的网络设备、服务器的监管由事件、告警管理展现;事件管理在新疆公安厅分为事件登记、事件分配、事件接收、提交处理、核实处理结果、事件结束几个流程步骤,而告警管理包括网络管理模块、服务器管理模块、数据库管理模块、中间件管理模块、安全产品管理模块以及流量管理模块的告警信息。所有告警信息可以根据故障严重程度、对业务影响范围以及客户具体要求进行分级告警,告警生命周期管理。
其二,运维服务电子化,通过工单流程,提供多种运维报表,对事件、问题、变更和资产等运维信息进行统计,支持表格、图形等多种方式展现。同时,运维工单管理在系统的使用过程中,根据不同时期的需求可能需要修改最初的运维工单,通过运维工单管理模块简化运维工单的设计和修改等功能。
声明:
凡文章来源标注为"CPS中安网"的文章版权均为本站所有,如需转载请务必注明出处为"CPS中安网",违反者本网将追究相关法律责任。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
相关阅读
征稿:
为了更好的发挥CPS中安网资讯平台价值,促进诸位自身发展以及业务拓展,更好地为企业及个人提供服务,中安网诚征各类稿件,欢迎有实力安防企业、机构、研究员、行业分析师。投稿邮箱: tougao@cps.com.cn(查看征稿详细)