监控易能做什么
网络拓扑
能够看到整个运营网络系统的网络拓扑结构,包括各个分布地区的子网、各个子网之间的网络连接关系、及其每一子网上的资源,并能直观地看到各个资源的状态变化
业务监控
从企业关心的业务视角出发,动态映射业务与IT资源的关联关系。以繁忙度、健康度、可用性等监控指标为维度,以状态列表、状态方块为展现形式,形成综合评价机制。通过业务树、业务报表等方式展示关联资源告警事件,快速溯源定位故障。
智能告警
系统突发问题的快速准确定位,告警策略灵活,针对不同对象的告警,支持以不同方式发送给相应的运维人员,实现分权限、多层级的管理。同时告警泛滥设置可有效避免大量重复的告警影响判断。
监控易的挑战
挑战 1:超大规模带来的性能要求
挑战 2:监控地域分布的广泛化带来的灵活扩展要求
挑战 3:监控模式的集中化带来的一体化监控需求
挑战 4:SLA服务水平要求高,运维人员少、运维强度大
挑战 5:故障如何快速预警、发现、定位、排查
挑战 6:开源工具数量众多、使用复杂、隐性成本高
面对指数增长、广域分布的接入设备,企事业单位如何才能对设备运行状态以及对运行在海量设备上的系统状态进行全局把控?如何才能让IT真正服务于企业成长?
监控易一体化工作
运维的工作可以分为运行监控和故障处理两个方面,对业务系统进行、完善的监控,保证能够在时间发现故障并迅速通知运维人员处理故障是运维监控系统要实现的基础功能;一个功能完善的智能监控系统,不但可以自动处理一些简单故障,减少运维工作量,还应该在应用可能出现故障时预先发出报警,预防故障发生。因此,构建一个智能的运维监控平台,必须以运行监控和故障报警这两个方面为重点,将所有业务系统中涉及的网络资源、硬件资源、软件、数据库资源等纳入统一的运维监控平台中,并通过消除管理软件的差别、数据采集手段的差别,对各种不同的数据来源实现统一管理、统一规范、统一处理、统一展现、统一用户登录、统一权限控制,终实现运维规范化、自动化、智能化的大运维管理。