大数据开发–基于ip2region实现在流式数据ip归属转换

小编小本本 • 2023年4月17日 am8:00 • VPS运维

大数据开发–基于ip2region实现在流式数据ip归属转换

你好，我是本际云服务器推荐网的小编小本本。在流式计算数据加工流程中，我们需要实现一种基于流式数据里面ip转换成对应的归属地信息。这个场景首先想到是如何找一个符合条件的ip映射库。

大数据开发--基于ip2region实现在流式数据ip归属转换

ip2region的应用

通过调研，开源ip2region.db数据库符合我们实际场景需求。本文档主要介绍在flink流式计算中如何使用ip2region，通过测试程序了解flink是如何加载外部文件机制。

实现方式

为了能够使用ip2region，我们需要下载项目并引用maven依赖。接下来，我们可以开始编写api来实现我们的需求了。

编写api比较简单就三行代码，采用的是memory查询算法。打包测试程序打包成功后，将程序提交到flinkonyarn环境之前，我们要考虑ip2regiog.db存储的位置及加载方式，否则在分布式环境下flink程序是无法读到该数据库。

我们提供了两种方式：一种是将ip2region.db数据库文件放入hadoop各计算节点上指定位置上，通过配置文件指定读取的路径；另一种是一次性加载方式，通过指向目录确保外部文件在存储的目录，并在提交的过程中自动分发到各个计算节点的classpath中。

方案二相比方案一优势明显，只需提交任务的时候指定外部文件在存储的目录，提交的过程，会自动分发到各个计算节占的任务所在的classpath中，很好解决了外部文件加载的问题。

以上就是我们在流式计算数据加工流程中，如何使用ip2region实现ip归属转换的方法。如果需要了解更多详情，请自行到官网地址查阅 https://github.com/lionsoul2014/ip2region。

原创文章，作者：小编小本本，如若转载，请注明出处：https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/6249.html

赞 (0)

小编小本本

pytest多文件执行顺序控制详解

« 上一篇 2023年4月17日 am8:00

nginx在哪里？-畅游互联网的必修课

下一篇 » 2023年4月17日 am8:00

VPS运维

什么是SAP系统(SAP系统的理解？)

什么是SAP系统？ SAP系统是SAP公司开发的企业管理解决方案软件，帮助企业从后台到决策层、从工厂仓库到商铺店面、从电脑桌面到移动终端，完成高效的协作，在竞争中脱颖而出。 SAP…

2023年4月15日
VPS运维

Oracle传输表空间

创建并授权directory目录在Oracle中传输表空间需要先创建directory目录并授权，可以通过以下命令创建一个名为dir的目录，并将其授权给public用户： Cre…

2023年4月16日
VPS运维

PostgreSQL逻辑和物理结构

PostgreSQL系统架构在了解PostgreSQL逻辑和物理结构之前，我们先了解PostgreSQL的系统架构。PostgreSQL使用一种客户端/服务器的模型。其会话由下列…

2023年4月20日
VPS运维

keepalived+nginx高可用反向代理实现

欢迎来到本际云服务器推荐网，我是小编小本本。今天给大家介绍一下如何通过keepalived和nginx实现高可用反向代理。一、nginx安装部署在安装nginx之前，需要进行主…

2023年4月20日
VPS运维

F5 BIG-IP 6900 硬盘更换说明

F5 BIG-IP 6900 硬盘更换说明你好，我是本际云服务器推荐网的小编小本本。本文将为大家介绍F5 BIG-IP 6900硬盘的更换方案。请确保您处于软件版本10.1.X以…

2023年4月10日
VPS运维

服务器托管一般多少钱一个月

服务器托管价格的因素服务器托管的价格通常取决于多个因素，包括托管方式、服务器类型、所需带宽和存储空间等。共享托管是虚拟主机托管，是最便宜的托管选项，适用于小型网站，并且价格通常…

2023年4月15日
VPS运维

轻松安装Nginx，提升网站性能（附：使用RPM安装教程）

引言如果你运营着一个互联网网站，那么提升网站性能无疑是你需要考虑的问题之一。而Nginx作为一款高性能的Web服务器和反向代理服务器，可以为你的网站提供快速响应和高吞吐量的服务。…

2023年4月19日
VPS运维

Nginx安装路径详解：如何正确配置nginx的安装路径（附：示例操作步骤）

什么是Nginx？介绍Nginx的基本概念及其主要作用。 Nginx的安装路径简单介绍Nginx的安装路径及其对应的文件夹。 Nginx的配置文件介绍Nginx的主要配置文件…

2023年4月16日
VPS运维

VMwareFT配置管理总结

VMwareFT介绍 VMware Fault Tolerance(FT)可最大限度地延长数据中心的正常运行时间，减少停机管理成本。通过消除传统硬件或软件集群解决方案的成本和复杂性…

2023年4月11日
VPS运维

Explain查看MySql执行计划

使用Explain命令查看Mysql执行计划在开发运维过程中，我们经常会碰到SQL执行缓慢的情况，此时可以使用Explain命令查看执行计划，并根据计划进行SQL的优化。 Exp…

2023年4月18日