应用正当时——浅析运维平台的构建与价值
当行业化大行其道之时,安防运维这种新的服务方式也随之发展,运维服务现已成为中大型安防项目建设不可缺少一部分,于是,业界很多人认为,它将赋予安防系统更全面、更广泛的内容,也将符合科技进步和时代发展方向。
一、运维平台,应用正当时
任何新产品和新技术在国家的政策推动和扶持下,必将迎来发展的春天。运维平台,同样如此。2015年3月公安部发文,针对联网平台运维管理模块在各省平安城市运维情况进行考核,联网指标、在线率、完好率和图像平台质量将成为公安行业视频监控系统运维情况考核的标准。同年5月国家发展改革委员会办公厅发文,明确表示加强公安安全视频监控全域覆盖建设,需做到全时可用(重点公安区域安装视频监控摄像机完好率达到98%,重点行业、领域安装的涉及公共区域的视频监控摄像机完好率达到95%,实现视频图像信息的全天候应用)和全程可控(公共安全视频监控系统联网应用的分层安全体系基础建成,实现重要视频图像信息不失控,敏感视频图像不泄露)。
这些迹象表明,随着平安城市和智慧城市建设推进,视频监控系统的规模在不断扩大,动辄上万个监控点,系统设备维护、维修管理工作量大大增加,单靠人力盲目巡检是根本不能满足业务需要的。尤其是社会治安视频监控,更是强调所有监控摄像头、网络、存储、应用系统能24小时都可用,在任何事件发生时都能发挥高清监控取证以及智能分析、预警等效用,真正使得视频监控系统起到监控作用。智能化、规范化的视频监控资产管理、运行监控、智能告警、运维管理、绩效评估的全流程运维管理是每一个视频监控系统建设必不可少的部分。
而建设全流程运维管理必须架构平台来完成管理与控制。英飞拓,围绕安防行业正在发生的革命性变化,持续为客户和全社会创造价值。在运维平台方面,我们的主张是:易安防、智安防。Infinova OMS运维平台,立志于协助维护人员在第一时间发现问题、解决问题,及时排除视频监控系统在运行过程中出现的故障。系统采用全方位立体式展现被监控IT资源、视频资源,进行全视角的IT业务服务综合管理;基于ITIL(信息技术基础架构库)的框架和精髓,预置ITIL的事件管理流程、问题管理流程、变更管理流程、发布管理流程、服务级别管理和资产与配置管理,并加上作业计划、知识库和日常事务管理,能够帮助IT运维组织快速搭建基于ITIL理念的运维体系;采用公司自主研发视频诊断算法,能够提供高效、准确的视频诊断功能。这种独步业界的“视频诊断+IT运维”一体化解决方案,全面破解视频监控系统面临的五大管理难题:
设备在线率低,系统可用性差,事发现场的关键录像难以达到图侦要求;
难以及时发现系统存在的RTSP及默认密码等重大安全漏洞;
难以及时发现系统存在的故障,无法快速精准的找出故障原因,无法使系统快速恢复正常;
系统的维护周期不可控,维护过程不透明,维护人员及维护工作难以监管;
设备资产状况不明晰,在线、在库、维护、报废等设备状态难以一目了然。
管中窥豹现一斑。在政策引领下,运维服务应用正当时,这是最好的时代。运维平台如同临危受命一般,以其强大完善的功能服务将视频监控提升到新的应用高度。然而,平台如何实现其功能呢?
二、如何建构运维平台来凸显应用价值
如何建构运维平台,是一难题,这需要运维平台根据各个行业监控业务的技术规范,提供视频诊断、录像完整性检测、设备在线检测、拓扑管理、资产管理、通用网络设备网管、工单流程管理、统计分析、值班管理、运维绩效考核管理等诸多功能,通过分析模型评估整个运维工作中的设备资产、管理人员、外包服务商的整体运行水平和趋势,反过来调整和优化设备、人员、服务的配置和管理,从而实现可持续发展、闭环的运维管理体系。
为此,要实现以上功能,需要了解英飞拓运维平台具体架构。它采用B/S架构,分布式部署,通过对视频相关资源的运行数据进行采集、分析并生成告警,来为运维人员提供集故障处理、运维流转、工作协同为一体的平台,适用于中大型视频监控运维应用。平台是由设备发现、设备管理、网络拓扑、事件管理、业务服务管理、告警管理、资产管理、配置管理、电子邮件、计费管理、问题管理、变更管理、值班服务台管理、考核管理、巡检管理、、报表管理、工作流管理、组织架构与权限、系统管理、智能搜索、知识库管理、公告及信息管理、工作台和工单管理等功能模块组成。同时对所有视频资源进行监测分析,当有设备出现故障时,大屏显示系统接收平台监控信息并在大屏上突出显示告警信息。运维人员看到大屏上显示的告警信息后,可通过PC机进入平台查看告警的具体信息并进行初步分析、判断,将该告警进行事件登记,登记后自动进入事件处理流程,待事件处理流程结束,该故障的处理结果将同步显示到大屏上。
 运维平台分为五层:
1、网元层又叫被监管层,在这一层标识出运维管理平台所要监控管理的各种资源类型,资源包括视频前端设备,视频传输设备、视频平台设备以及基础IT设备等。
2、数据采集层承担对网元层各种资源的运行状态和事件数据进行抓取和采集,主要提供Agent(代理)和Agentless(无代理) 标准协议及SDK方式进行数据采集。
3、数据分析层主要是对数据采集层采集到的数据进行告警规则引擎、状态计算、定时调度、视频质量分析、根本原因分析、业务分析、事件的Flaping计算等分析处理。数据分析层负责对数据采集到的数据进行分析。包括性能状态计算,告警确认,汇总等分析处理功能。按照职责独立原则,在数据分析层划分为以下组件:
调度服务:即轮询管理服务,根据资源监控策略所设置的指标监控频度,定时的触发指标的采集调度。调度服务可以支持按秒级粒度触发调度。
规则引擎服务:定义并解析处理资源监控策略所设置的监控规则,这些规则包括频度、阈值、事件、动态基线等可以由原子规则叠加复合处理。规则引擎为调度服务、状态服务、告警服务等提供解析服务。
状态服务:当采集到指标数据后,状态服务会调用规则引擎来跟踪策略中设置的阈值,计算资源指标项当前的状态,如红(异常)、绿(正常)等。
性能分析:当指标的状态发生变化时,性能分析服务会根据策略中设置的事件规则产生性能事件。
告警服务:当有事件产生时,无论可用性、性能等事件,告警服务会根据策略中定义的告警规则来触发告警。同时推送告警到业务管理层。
关系分析:当整体业务或某视频终端产生告警时,关系分析服务可以利用资源间关联关系进行根本原因分析,准确定位视频终端告警是因为接入网络设备故障、链路故障还是因为视频服务器等故障造成。
汇总服务:汇总服务负责对采集的指标数据按照30分钟,1小时,6小时,1天等汇总频度进行计算最大值,最小值,平均值的汇总。同时把汇总数据递交到数据存储服务,进行数据持久化。
数据存储服务:数据存储服务由DB访问组件DAL完成。DAL组件内部封装了利用JDBC访问数据库的各种方法。
4、业务管理层(也叫数据业务层)将分析后的数据与各业务功能进行结合,形成各业务功能模块。运维管理平台按照功能划分为运维管理、视频诊断、运维服务。
5、应用展现层(也叫数据展现层),即用户交互UI。其具体显示媒体支持普通显示器以及大屏。展现效果可以自适应高分辨率显示。运维管理平台通过Portal门户把数据展现给用户。在展现层,设计上提供按照不同运维人员个性化进行展现。首页、报表分析、实时告警台等页面支持个性化风格定制,为领导、系统管理员、业务运维人员等不同角色设计更直观,更清晰,差异化的数据样式进行展现,这些样式包括合理的数据布局,酷炫的Flash动画效果等。
平台在实际应用中才能凸显价值。举一具体案例,新疆公安厅希望建立一种以流程为导向,以业务为中心、注重服务意识的管理模式,提高系统维护效率、减低运维成本、完善系统建设和运维历史档案管理、监督系统维护工作、评估系统运行绩效、优化系统设计和保障系统持续良好运行,来提高智能视频系统应用,加强社会面管控及维稳能力,为建设平安新疆打下坚实基础。英飞拓运维平台成功应用于新疆公安厅,并为其创造了新的服务价值,大致有五点:
其一,省厅对管辖内的网络设备、服务器的监管由事件、告警管理展现;事件管理在新疆公安厅分为事件登记、事件分配、事件接收、提交处理、核实处理结果、事件结束几个流程步骤,而告警管理包括网络管理模块、服务器管理模块、数据库管理模块、中间件管理模块、安全产品管理模块以及流量管理模块的告警信息。所有告警信息可以根据故障严重程度、对业务影响范围以及客户具体要求进行分级告警,告警生命周期管理。
其二,运维服务电子化,通过工单流程,提供多种运维报表,对事件、问题、变更和资产等运维信息进行统计,支持表格、图形等多种方式展现。同时,运维工单管理在系统的使用过程中,根据不同时期的需求可能需要修改最初的运维工单,通过运维工单管理模块简化运维工单的设计和修改等功能。
 其三,由于以上的运维服务生成性能分析报表,这是一个依赖监测数据,然后把数据整合并且与基准值对比,最终形成对整个视频系统的健康情况的整体评分审查。以宏观角度对视频系统进行全面分析,提供性能分析描述建议,得到整个视频系统的运行情况,找到视频系统的性能瓶颈。如此一来,新疆行政辖区内县市视频设备故障情况被了如指掌,也方便及时下达通知督促整改以及形成整改建议方案。
其四,可以根据生成的运维服务统计数据实现对资产的采购、入库、维修、借调、领 用、折 旧、报 废 等 生命周 期 各 阶 段 的 管 理 功 能,同时对设备的网络优化提供参考。
其五,用户进入门户系统时,系统的访问控制功能对访问者进行身份认证,合法用户将被赋予相应的门户访问权限。新疆公安厅设定为最高权限,可以直接登录操控各县市运维平台的运营情况,了解诸多运维信息。
项目建设完成一直正常运行至今,新疆公安厅收益到建设成效,首先,他们已经完善事件管理流程和深入的问题挖掘,由被动管理转变为主动管理,提高省厅满意度以及工作效率。其次,通过运维平台快速指出所有技术域内影响服务的问题来源改善服务质量,同时指出所有技术域内对服务造成危险的来源改善服务可预测性。最后,通过减少报警和服务管理所需的人力,减少省厅和个县市修复和服务问题的时间,提高工作效率。
结束语
运维的概念是从IT被嫁接到安防,现今在国家政策大力推动下,迎来规模化应用的机遇期。如何在平台功能方面做到尽善尽美,还需一个过程,也需要市场给予耐心。就目前应用而言,平安城市运维平台走在行业最前沿,甲方形成了完整的城市视频监控运行维护管理体系,实现对城市视频监控系统及其基础支撑运行环境的可视、可控、可管理,实现设备故障主动监控、规范日常维护流程、量化运行服务质量,持续优化维护流程和监控策略,从而持续提升城市视频监控系统的整体运行维护管理水平,为持续提升城市视频监控系统的运行效益提供有力保证。成就客户即成就自己,在创新的道路上我们还将持续探索。
声明:
凡文章来源标注为"CPS中安网"的文章版权均为本站所有,如需转载请务必注明出处为"CPS中安网",违反者本网将追究相关法律责任。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
相关阅读
征稿:
为了更好的发挥CPS中安网资讯平台价值,促进诸位自身发展以及业务拓展,更好地为企业及个人提供服务,中安网诚征各类稿件,欢迎有实力安防企业、机构、研究员、行业分析师。投稿邮箱: tougao@cps.com.cn(查看征稿详细)