1. 本际云推荐 - 专业推荐VPS、服务器,IDC点评首页
  2. 云主机运维
  3. VPS运维

基于平台的应急开机效率提升分享

基于平台的应急开机效率提升分享

大家好,我是本际云服务器推荐网的小编小本本。今天我想分享一些关于业务相关知识和在遇到问题后如何基于平台沉淀场景的经验。特别是在应急开机效率提升方面,希望能对大家有所帮助和启发。

基于平台的应急开机效率提升分享

应急开机介绍

应急开机是在系统出现异常终端用户已正常缴费但仍未复机情况下,强制生成开机工单给用户快速开机,恢复用户服务,以此保证客户终端使用,避免造成大规模终端用户投诉的一套程序。应急开机涉及如下环节的检查和监控:

  • 应急进程检查:应急处理进程重启和检查;
  • 应急模式调整:常规应急模式需要根据字典组判断营业用户状态和停机锁,无条件应急模式不判断营业用户状态和停机锁直接开机;
  • 应急开机程序启动:待开机用户号码的提取、处理,如提取指定时间段的缴费用户等;
  • 应急开机数据检查:检查应急开机扫描用户数据及其处理情况;

以上各环节监控,以前均是通过手工登录对应主机或者物理库执行监控脚本的形式进行检查。这种方法操作时间长,容易出现顾头不顾尾的情况,导致部分节点遗漏监控,从而降低应急开机的及时性。

自动化运维平台应急拓扑图介绍

为了解决上述问题,可以引入自动化脚本或可视化页面,摈弃手工执行监控脚本的方式。例如,自动化运维平台中的拓扑图模块完全具备使用拖拉拽节点的方式组合完整业务流程图,并在节点上展示监控数据。通过这种方式可以达到一站式展示应急开机程序启动后各个环节处理情况的目的。这种拓扑图可以将应急开机各个环节全部以节点的形式展示出来,包括处理进程的数量、应急模式是常规还是无条件、应急开机数据处理情况及处理量、工单积压情况及处理量、已开机用户量及随机抽查的号码等。启动应急程序后,只需打开该流程图即可清晰地看到各个环节处理情况,避免了手工操作时间长,顾头不顾尾的问题。

以平台为依托,把各环节的固定监控交给平台,从繁多的手工监控中抽身出来,更多关注业务层面的及时性、有效性、连续性以及故障的前因后果,持续将完整业务流程场景化可视化工作迭代下去。

结尾

以上就是我今天分享的关于基于平台的应急开机效率提升的经验。希望这些内容对大家有所帮助,我们下次再见。

原创文章,作者:小编小本本,如若转载,请注明出处:https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/5818.html