报错概述
本文介绍最近Gbase资源管理cgroup导致的问题。在创建资源池后出现gcrecover日志报错。

分析思路
由于是新库,数据为空,因此可以排除状态不正常导致的表数据不一致。接下来需要从资源计划,资源池等信息入手查找问题。这些设置都没有问题,因此向主机的参数方向查找问题。在Gbase管理员手册中找到了依托于系统服务cgroup的资源管理功能。cgroup是操作系统的一个组件,因此顺着cgroup思路向下查找问题。在使用c3工具查看cgroup状态时发现cgroup服务找不到。这说明cgroup服务没有开启或者缺少相关的包。
解决方案
经过分析,发现缺少libcgroup-tools包,这是启动cgroup的服务工具。使用c3工具全节点安装该包,然后全节点启动cgroup服务。集群状态依然不正常。接下来检查lscgroup的mount状态和/etc/cgconfig.conf配置文件,对比正常机器的配置文件,发现有问题机器缺少一些内容。将缺失的内容补充上去,并执行cgclear清除掉默认的所有挂载。接下来按步骤停止cgroup服务和启动cgroup服务。如果重启cgroup服务未发生变化,可以重启集群服务,再重启cgroup服务。最后将正常主机的/etc/cgconfig.conf配置文件复制到各个gnode上,执行cgclear后,依次重启cgroup服务。重启数据节点cgroup服务后,集群状态已恢复正常,同时event事件也没有了。
以上就是本次Gbase资源管理cgroup问题的全部内容。关注IT那活儿获取更多精彩干货。
原创文章,作者:小编小本本,如若转载,请注明出处:https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/6044.html
