hbase读写原理

小编小本本 • 2023年4月17日 am8:00 • VPS运维

HBase读写原理

在HBase中，读写是两个核心操作，下面将介绍HBase的读写流程。

hbase读写原理

HBase读流程

在HBase中，读流程包括以下步骤：

Client访问zookeeper，并从meta表读取region的位置和数据。
根据namespace、表名和rowkey在meta表中找到对应的region信息。
找到该region对应的regionserver。
查找对应的region。
先从MemStore中查找数据，没有再从BlockCache中读取。
如果BlockCache中仍没有，再从StoreFile中读取。
如果从StoreFile中读取数据，则先写入BlockCache，再返回给客户端。

HBase写流程

在HBase中，写流程包括以下步骤：

Client向HregionServer发送写请求。
HregionServer将数据写到HLog（writeaheadlog）。
HregionServer将数据写到内存（MemStore）。
反馈Client写成功。

此时，数据还未写到磁盘上，如果发生故障可能会导致数据丢失，因此需要进行数据flush。

数据flush过程

当MemStore中的数据达到阈值（默认为128M）时，将数据刷到硬盘上，同时将数据删除，删除HLog中的历史数据，并将数据存储到HDFS中。

在写入过程中，如果数据量较大，会进行数据合并和拆分。

数据合并过程

数据块达到4块时，Hmaster将数据块加载到本地进行合并。当合并的数据超过256M时，进行拆分，并将拆分后的Region分配给不同的HregionServer进行管理。当HregionServer宕机后，将Hlog拆分，然后分配给不同的HregionServer加载，修改.META.。

当出现HLog灾难时，可以使用以下方法进行恢复：

不要对regionserver进行任何操作，持续观察WALlog日志是否在跟新恢复。
等待HLog灾难恢复完成后观察GC，若GC几乎没有再次积压，则前端业务可以正常处理积压。

以上是HBase读写的原理和流程，希望对读者有所帮助。

原创文章，作者：小编小本本，如若转载，请注明出处：https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/6289.html

赞 (0)

小编小本本

AI绘画是否会取代人类绘画的工作？

« 上一篇 2023年4月17日 am8:00

如何使用关键词启动nginx服务（附：详细步骤）

下一篇 » 2023年4月17日 am8:00

VPS运维

告警异常检测实现

异常检测实现我是本际云服务器推荐网的小编小本本，今天想和大家分享一下异常检测实现的相关知识。孤立森林算法异常检测离群点是在给定数据集中，与其他数据集显著不同的点。针对于不同类…

2023年4月16日
VPS运维

集成安装之Oracle12C补丁升级数据字典更新报错处理

Oracle12C补丁升级问题解决之集成安装问题在数据库版本12.2.0.1升级时是否RAC，是需要注意的问题。即使我们希望一切顺利，但对于老手而言，新问题的出现也是自我提高的过…

2023年4月15日
VPS运维

如何正确卸载nginx？（附：nginx卸载教程）

为什么要正确卸载nginx？在使用nginx期间，可能会遇到需要卸载nginx的情况。正确卸载nginx可以确保系统干净地从计算机中删除该软件，并避免在服务器上留下不必要的垃圾文…

2023年4月17日
VPS运维

oracle到db2透明网关配置

Oracle到DB2透明网关配置作为本际云服务器推荐网的小编小本本，今天给大家分享一下如何配置Oracle到DB2的透明网关。这是因为我们需要从DB2中取出数据，使用透明网关来实…

2023年4月18日
VPS运维

python运用csv格式文本文档之csv.DictReader()方法

介绍Python中csv.DictReader()方法作为本站小编小本本，今天为大家介绍一种Python中运用csv格式文本文档的方法——csv.DictReader()。本文将…

2023年4月19日
VPS运维

openGauss数据库部署

openGauss数据简介 openGauss是一款开源关系型数据库管理系统，融合华为在数据库领域多年的经验，结合企业级场景需求。截止目前一共发布了6个版本，目前最新版本为2.0。…

2023年4月18日
VPS运维

使用裸机云的优势有哪些？

裸机云 VS 虚拟化云：你该如何选择我是本际云服务器推荐网的小编小本本。裸机云和虚拟化云模型都提供类似的功能和优势。它们都有助于基于需求和基于DevOps的配置和按需付费预算。但…

2023年4月18日
VPS运维

python合拼RepeatMasker预测分析效果中染色体的overlap区域

序言本篇文章主要介绍了如何使用Python合并RepeatMasker预测分析效果中染色体的overlap区域，以及完成实例分析。RepeatMasker是一款重复序列注解的主要…

2023年4月16日
VPS运维

程序内存溢出问题分析

程序内存溢出问题分析本文将讨论程序内存溢出问题的分析以及解决方法。 JVM虚拟机 Java语言使用Java虚拟机屏蔽了与具体平台相关的信息，使得Java语言编译程序只需生成在Ja…

2023年4月19日
VPS运维

记一起tuxedo中间件服务阻塞故障案例

故障背景本际某系统前端统计分析发现，当天前端调用tuxedo中间件多个服务出现调用时间增长较多，并间歇性出现“服务调用出错.”情况。问题出现时间点短暂无规律，问题持续下去会逐步拉…

2023年4月15日