1. 本际云推荐 - 专业推荐VPS、服务器,IDC点评首页
  2. 云主机运维
  3. VPS运维

Hbase运维实践分享

HBASE介绍

关系型数据库采用丰富的数据类型和存储方式,而HBase则采用简单的数据模型,将数据存储为未解释的字符串。

Hbase运维实践分享

HBase操作简单,只有插入、查询、删除和清空等操作,所以不存在复杂的表和表之间的关系。

HBase基于列存储而非基于行模式存储,只有一个索引——Rowkey,并且更新操作不会删除旧版本,而是生成新版本。

相比之下,关系数据库很难实现横向扩展,而HBase是为灵活的水平扩展而开发的,可通过在集群中增减硬件数量实现性能伸缩。

HBASE数据热点

数据热点问题是大量Client直接访问一个或极少数个节点,而集群中的其他节点处于相对空闲状态。

HBase根据Rowkey来检索数据,而不合理的Rowkey设计会导致热点问题。

可以通过加盐、Hashing、反转和调整Rowkey长度等方式来避免热点问题。

HBASE常见故障及处理

RegionServer异常下线可能是由于主机磁盘写数据繁忙等原因引起的,解决方法是检查日志和nmon图分析,通过更换故障的hadoop数据盘解决问题。

请求异常可通过HBaseUI查看,请求数量是否正常,通过日志和netstat命令解决SYN_RECV等问题。

HBASE压缩

采用压缩优化解决方案可用最少的投资承载更多的数据存储,降低存储资源消耗,适用于写入一次、查询少量的温冷数据场景。

入库时采用SNAPPY压缩,不影响数据入库效率。业务闲时,可以修改数据压缩方式为GZ。

具体实现步骤为禁用后修改压缩方式并启用,然后执行major_compact操作。测试结果表名压缩前大小(snappy)压缩后大小(GZ)。

原创文章,作者:小编小本本,如若转载,请注明出处:https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/5914.html