1. 本际云推荐 - 专业推荐VPS、服务器,IDC点评首页
  2. 云主机运维
  3. VPS运维

数据库异常宕机分析报告

数据库异常宕机分析报告

本文主要描述了某数据库从6月29日起连续多天异常宕机的情况及原因分析。

数据库异常宕机分析报告

问题分析

从数据库alert日志和系统message日志来看,系统内存溢出导致数据库核心进程dbwn被killed,进而引发异常宕机。具体原因分为以下三点:

  1. 数据库alert日志报错
  2. 一些重要进程diedunexpectedly,例如InstanceCriticalProcess(pid:21, ospid:105559, DBW2)等。这些错误提示暗示着系统内存运行状况不佳。

  3. 系统message日志报错
  4. 系统message日志显示Outofmemory和Killed process等错误信息,这说明系统内存溢出情况比较严重,swap分区已被全部使用。

  5. 系统内存使用情况
  6. 内存cache占用过高,swap交换分区已被全部使用。

故障处理

  1. 关闭asm实例及has
  2. 由于asm实例相关进程占用了较多swap分区,首先尝试关闭asm实例和hassrvctl停止asmcrsctl停止has。

  3. 清理swap交换分区
  4. 除关闭相关进程外,还需要清理内存cache,确保系统空闲内存大于已用swap内存, 关闭swap分区并杀掉占用较多swap的进程。

  5. 调整swappiness参数
  6. swappiness参数规定了内存占用超过物理内存大小时,实际内存和swap分区内存的比例。因此,需要根据实际情况调整swappiness参数值,以加速系统恢复。

  7. 启动数据库,并调整SGA和PGA
  8. 最后,重新启动数据库,并根据客户要求,适当调整SGA和PGA大小。

本次异常宕机详细问题分析和解决方法已经介绍完毕,如有需要可参考上述步骤逐一解决问题。

原创文章,作者:小编小本本,如若转载,请注明出处:https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/6113.html