HBASE介绍
关系型数据库采用丰富的数据类型和存储方式,而HBase则采用简单的数据模型,将数据存储为未解释的字符串。

HBase操作简单,只有插入、查询、删除和清空等操作,所以不存在复杂的表和表之间的关系。
HBase基于列存储而非基于行模式存储,只有一个索引——Rowkey,并且更新操作不会删除旧版本,而是生成新版本。
相比之下,关系数据库很难实现横向扩展,而HBase是为灵活的水平扩展而开发的,可通过在集群中增减硬件数量实现性能伸缩。
HBASE数据热点
数据热点问题是大量Client直接访问一个或极少数个节点,而集群中的其他节点处于相对空闲状态。
HBase根据Rowkey来检索数据,而不合理的Rowkey设计会导致热点问题。
可以通过加盐、Hashing、反转和调整Rowkey长度等方式来避免热点问题。
HBASE常见故障及处理
RegionServer异常下线可能是由于主机磁盘写数据繁忙等原因引起的,解决方法是检查日志和nmon图分析,通过更换故障的hadoop数据盘解决问题。
请求异常可通过HBaseUI查看,请求数量是否正常,通过日志和netstat命令解决SYN_RECV等问题。
HBASE压缩
采用压缩优化解决方案可用最少的投资承载更多的数据存储,降低存储资源消耗,适用于写入一次、查询少量的温冷数据场景。
入库时采用SNAPPY压缩,不影响数据入库效率。业务闲时,可以修改数据压缩方式为GZ。
具体实现步骤为禁用后修改压缩方式并启用,然后执行major_compact操作。测试结果表名压缩前大小(snappy)压缩后大小(GZ)。
原创文章,作者:小编小本本,如若转载,请注明出处:https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/5914.html
