1. 本际云推荐 - 专业推荐VPS、服务器,IDC点评首页
  2. 云主机运维
  3. VPS运维

运营商CRM系统架构及运维体系分享

运营商CRM系统架构

随着客户对合作厂商能力要求越来越高,已经不能满足于技术方面的能力,工作内容越来越需要业务支持,本次分享给大家主要介绍运营商CRM系统架构及日常运维工作中的告警部署、优化方式。本次分享分为三个部分:CRM系统架构告警部署、优化方式应急开机业务流程

运营商CRM系统架构及运维体系分享

CRM系统架构大致可分为三层:1.Web层:指weblogic服务,主要包含:一级BOSS、EUBS服务、能力开发平台、CRM前台web等子系统模块;2.tuxedo:主要的业务逻辑处理功能,包含:客服、一级boss、电子渠道、营业前台、后台进程、接口、信控等功能模块;3.数据存储层:主要包含营业数据库、账务数据库、服务开通库、coherence、Vsearch、hadoop;其中Vsearch存储的是各个业务的产品信息,coherence存储的是用户的访问会话信息,hadoop存储的是系统采集用户的二代证信息及人像。根据业务途径可以分成以下4个主要子系统:

  • CRM营业前台主要指BOSS(业务运营支撑)系统的前台页面,用户通过访问该页面进行业务办理;
  • 服务开通主要向网管同步用户数据,由网管提供移动通信基础服务功能;
  • 一级BOSS受理全网业务;作为发起方向集团或者外围平台厂商发送交易请求,作为落地方接受并处理集团或者外围厂商平台发送的交易请求;
  • 电子渠道主要承接非营业前台途径受理的本地业务,例如短厅办理,网厅办理等。

不同子系统中包含的不同业务逻辑,通过Weblogic、Tuxedo中间件进行通信;整个系统架构较为复杂,需要保证每个子系统之间的正常通信,以确保系统的正常运行。

告警部署及优化

目前整个CRM系统的告警监控工作,在日常部署及处理告警监控分两大类:1.系统监控性能监控:CPU使用率、内存使用率、文件系统利用率;2.业务监控进程监控:进程数异常;数据监控:数据库表数据积压、数据处理失败、数据处理的及时性;日志监控:日志报错信息;随着新项目的接入以及为了预防故障而增加相应告警,告警数量会越来越多,自然而然的增加了日常工作压力,怎么来应对越来越多的告警呢?是摆在一线运维工作人员面前的一道重要问题。

目前主要的处理方式是每隔一段时间处理的告警进行收集、分析并总结,上会讨论并确定告警优化方案,最终根据告警优化方案,再次部署告警,实现告警压降。告警优化主要分为以下4种方式:

  • 部署定时清理任务;
  • 告警处理前移;
  • 调整告警策略及阀值;
  • 趋势告警。

应急开机业务流程

应急开机是为预防因系统出现异常时用户未及时开机而导致大面积投诉的情况,通过多种方式将用户进行快速开机从而恢复用户服务的一套程序,最终目的是避免用户投诉。

业务逻辑:账务侧抽取需要进行应急开机的数据(三种类型:指定号码,缴费应急开机,服务开通停机回捞),插入营业库一张中间表;通过应急开机进程处理中间表的数据,向营业侧传输数据;有两种传输模式:营业信控与服务开通;营业信控模式:应急开机数据导入营业库工单表,再由营业工单复制进程与send进程从营业库同步到服务开通库工单表中;服务开通模式:应急开机数据直接导入服务开通库中的工单表中;服务开通库的工单表由对应的HLR进程及PROVSION进程处理工单数据,向网管进行数据同步。

后续工作规划:核心业务拓扑图加快核心业务流程梳理,建立业务拓扑图并在自动化运维平台进行部署;运维工作自动化梳理日常工作中常态化的人工操作,编写脚本,迁移至自动化运维平台;经验积累沉淀转化故障、告警处理经验总结,形成前置性标准规范及自检,加强问题隐患的前置性处理。

原创文章,作者:小编小本本,如若转载,请注明出处:https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/5858.html