| 性能监测 |
| 带宽利用率报告 |
对向外和向内的流量进行带宽统计。适用于广域网物理接口和广域网逻辑子接口 |
| 带宽利用率曲线图 |
基于带宽利用率报告产生曲线图 |
| 在线告警记录 |
SNMP traps、未响应的轮询和其它的设备告警被保存在一个易于查询、且进行汇总的在线日志里。所有的告警事件由监控中心业务规则管理器过滤,同时根据预先定义的设备重要度,这些事件会被分配一个故障严重等级。设备重要度的定义使得设备可以根据其对业务的重要性进行分组 |
| 在线设备状态 |
最新的设备状态,表示为critical、major、minor或normal不同状态级别。这是一个实时的状态,表示出现了一个告警或一个论询无法完成 |
| 健康监测 |
| CPU 利用率 |
测量和报告CPU利用率 |
| 内存利用率 |
测量和报告内存的利用率 |
| 在线健康曲线图 |
把健康监控的统计数据形成曲线图 |
| 故障管理 |
| 故障处理 |
工程师对故障进行实时监控。工程师在监测到故障后,根据和客户方预先定义的故障处理流程,将故障上报到客户方相关负责人员。工程师跟踪整个故障解决过程,协助客户方直到问题解决(包括协调现场资源、硬件维护方和其它第三方) |
| 自动上报 |
呼叫管理系统会根据以下条件将未及时解决的故障上报给高级工程师和不同级别的经理:问题的优先级、最后更新的时间、case创建的时间、目前case的状态 |
| 硬件维护 |
在用户购买设备代维服务后。当硬件出现故障并需要更换时,乙方会协调硬件供应商进行硬件更换,并在乙方的指导下进行基本的软件配置,乙方对其整个服务过程其进行跟踪管理,并建立相应的故障记录 |
| 客户定义的设备重要度 |
设备重要度的定义使得监控中心在解释一个故障的严重程度时,是基于对业务的影响程度,而不是技术特性。设备被按照业务重要性分类,监控中心业务规则管理器根据设备的重要度确定故障的严重程度。例如一个供电故障发生在一个被定义为“normal”的设备上时,系统可能会产生一个“轻度”告警,而同样的故障发生在一个被定义为“vital”的设备上时,系统则可能会产生一个“严重”告警 |
| 基于设备的故障处理策略和上报策略 |
故障处理策略用于定义当一个故障发生时,工程师所采取的故障处理步骤。故障处理策略可以是简单的两三句定义,如“如果故障在10分钟内无法远程解决,通知现场联系人”。针对每个设备都可以定义一个缺省的、用于上班时间和下班时间两个不同时间段的故障处理策略 |
| 信息管理 |
| 上报流程 |
当产生一个告警后,工程师将按照为该设备定义的故障处理策略进行处理。如果工程师不能执行故障处理策略中定义的某些操作,或者预见到故障情况会进一步恶化时,工程师就会启动上报流程。通常上报流程中会指定特定的上报联系人,例如的客户服务经理和客户的IT经理 |
| 设备地点信息 |
设备地点信息记录一个设备的物理位置。这些信息对现场工程师很重要 |
| 联系人信息 |
联系人信息是指客户方协调人员的联系方式。一般来说这个人应该被允许开关设备并能提供该设备的相关信息。如果需要他协助来解决问题,工程师将联系客户方协调人员。最好有2个联系人以上,以确保发生问题时至少可以联系到一名人员。如果第一个协调人员联系不上,工程师将呼叫第二个,如果还联系不到,将呼叫第三个。如果都找不到的话,将启动上报流程 |
| 在线文档 |
通过监控中心可以查看客户网络图 |
| 运营商信息 |
运营商信息,包括线号、带宽、故障上报流程等信息都存储在监控中心里,以便快速检索。运营商信息与具体设备相关联,因此用户可以知道和每个设备相关联的运营商服务 |
| 配置和变更管理 |
| 配置和变更管理 |
如果最终用户要求提供OS Patching或升级服务,双方须将此种变更作为项目处理并定义项目范围,将根据工作量另行收费 |
| 响应 |
| 24 x 7 故障处理策略 |
工程师提供24x7的故障响应服务 |
| 工程师15分钟内响应 |
在检测到故障后,工程师在15分钟以内启动故障处理流程 |
| 工程师30分钟内响应 |
在检测到故障后,工程师在30分钟以内启动故障处理流程 |
| 故障处理每30分钟跟踪 |
工程师在处理故障时会每隔30分钟向客户沟通一次当前故障处理状态 |
| 故障处理每1小时跟踪 |
工程师在处理故障时会每隔1小时向客户沟通一次当前故障处理状态 |