Python开展文字识别中的省份并绘图丨本际云推荐

介绍Cpca模块

正在进行NLP（自然语言处理）相关任务完成后，经常碰到务必辨别并获得省、大都市、行政区的需求。虽然自身依据关键词表一个一个搜索也可以实现获得目的，但必须要先搜集省份关键词表，相对而言比较复杂。

Python开展文字识别中的省份并绘图

今天给大家介绍一个模块，你只需将结构体数组传递给这个模块，他就可以给你返回这个结构体数组内的省、市、区关键词，并可以给你在图片里标出下去，它是Cpca模块。

基本使用

通过两行代码就能实现最基本的省市区提取：

# 公众号:Python实用宝典
# 2022/06/23
import cpca
location_str=[
    "广东省深圳市福田区巴丁街深南中路1025号新城大厦1层",
    "特斯拉上海超级工厂是特斯拉汽车首座美国本土以外的超级工厂，位于中华人民共和国上海市。",
    "三星堆遗址位于中国四川省广汉市城西三星堆镇的鸭子河畔，属青铜时代文化遗址"
]
df=cpca.transform(location_str)
print(df)

效果如下：

省	市	区	地址	adcode
广东省	深圳市	福田区	巴丁街深南中路1025号新城大厦1层	440304
上海市	None	None	特斯拉上海超级工厂是特斯拉汽车首座美国本土以外的超级工厂，位于中华人民共和国上海市。	310000
四川省	德阳市	广汉市	城西三星堆镇的鸭子河畔，属青铜时代文化遗址	510681

注意第三条的广汉市，cpca不仅识别到了语句中的县级市广汉市，还能自动匹配到其代管市的德阳市，非常强大。

高级使用

它还可以从大段文本中批量识别多个地区：

#公众号:Python实用宝典
# 2022/06/23
import cpca
long_text="对一个城市的评价总会包含个人的感情。如果你喜欢一个城市，很有可能是喜欢彼时彼地的自己。"
"在广州、香港读过书，工作过，在深圳买过房、短暂生活过，去北京出了几次差。"
"想重点比较一下广州、深圳和香港，顺带说一下北京。总的来说，觉得广州舒适、"
"香港精致、深圳年轻气氛好、北京大气又粗糙。答主目前选择了广州。"
df=cpca.transform_text_with_addrs(long_text,pos_sensitive=True)
print(df)

效果如下：

省	市	区	地址	adcode
广东省	广州市	None	None	440100-1
香港特别行政区	原创文章，作者：小编小本本，如若转载，请注明出处：https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/5781.html 赞 (0) 小编小本本生成海报 kubebuilder扩展k8s « 上一篇 2023年4月18日 am8:00 「学会nginx的简单方法，轻松成为Web服务器大师」（附：7款高质量教程推荐）下一篇 » 2023年4月18日 am8:00 相关推荐 VPS运维什么是SAP系统(SAP系统的理解？) 什么是SAP系统？ SAP系统是SAP公司开发的企业管理解决方案软件，帮助企业从后台到决策层、从工厂仓库到商铺店面、从电脑桌面到移动终端，完成高效的协作，在竞争中脱颖而出。 SAP… 2023年4月15日 VPS运维 Mysql数据库锁情况下开启备份导致数据库无法访问处理分享背景简介 MySQL是一种开放源代码的关系型数据库管理系统，因为其速度、可靠性和适应性而备受关注。针对mysql5.7.25的锁表故障进行分析处理。分析过程 1、首先接到业务反馈… 2023年4月16日 VPS运维 MySQL5.7执行count()比MySQL5.6执行更慢您好，我是本际云服务器推荐网的小编小本本。最近我们遇到了一个非常有意思的问题，用户将MySQL5.6升级到MySQL5.7之后，执行count()统计类SQL语句会变得非常缓慢，… 2023年4月16日 VPS运维集群修改publicIP和VIP 集群修改publicIP和VIP 作为本际云服务器推荐网的小编小本本，今天为大家分享一篇有关集群修改publicIP和VIP的文章。实施步骤以下是具体实施的步骤： 1. 集群I… 2023年4月15日 VPS运维解读高级前端必会的package.json字段前端项目的package.json文件中相关的字段含义及使用场景小编小本本今天想为大家讲讲前端项目的package.json文件中相关的字段含义及使用场景。通过了解这些字段，我们… 2023年4月19日 VPS运维 ORACLE数据库AWR及ASH使用手册 AWR及ASH日常使用我是本际云服务器推荐网的小编小本本，要给大家介绍一下ORACLE数据库AWR及ASH使用手册。首先，AWR用于过去一段时间数据库性能及故障分析，搜集分析指标… 2023年4月15日 VPS运维深圳服务器托管您好，我是本际云服务器推荐网的小编小本本。今天我将为您介绍深圳服务器托管服务。什么是深圳服务器托管服务？深圳服务器托管是指将服务器设备托管在深圳的机房内，由专业的机房运营商负责… 2023年4月18日 VPS运维如何优雅的打印日志关于日志管理的重要性作为一名开发人员，日志管理是软件开发中一个不可忽视的重要部分。在开发过程中，开发者可以通过IDE或其他调试工具来进行日志输出和调试。然而，在软件的生命周期中… 2023年4月15日 VPS运维 Python中True(真)和False(假)判断详解 Python中的True和False 在Python中，if条件语句中的True和False非常重要，不同使用方法会带来不同的结果。逻辑取反、if条件式和pandas.DataFr… 2023年4月15日 VPS运维代销货源平台有哪些(直播代销什么意思？) 直播代销是什么？直播代销是依托于主播才能实现的。商家入驻平台开通直播功能，主播为商家直播带货，用户观看直播后可在直播间内下单购买商品。平台会提取流水，同时主播也可以获得代销收益。… 2023年4月18日小编小本本最近文章 Hexo主题高级自定义学习js中的’this’关键字 Python海象运算符的用法教程 python并发场景锁的使用方法两步完成谷歌广告开户(如何投放googleadsense？) Hexo主题高级自定义 2023年4月20日学习js中的’this’关键字 2023年4月20日 Python海象运算符的用法教程 2023年4月20日 python并发场景锁的使用方法 2023年4月20日两步完成谷歌广告开户(如何投放googleadsense？) 2023年4月20日德国节日里哪些是比较有传统特色的(欧洲世俗节日？) 2023年4月20日四海商舟(ag创始人都有谁？) 2023年4月20日 Python简要解读filter函数用法 2023年4月20日运用Python完成简易短信验证码解决 2023年4月20日 Greenplum表故障处理–Primary和mirror 2023年4月20日标签 centos CN2线路 GPU服务器 PIGYun RAKsmart RAKsmar优惠 vps Vultr 云服务器云计算华纳云国外VPS 域名注册日本vps 日本服务器服务器美国VPS 美国服务器美国独立服务器美国私人vps 腾讯云腾讯云最新活动腾讯云轻量轻量云服务器阿里云韩国vps 韩国服务器香港vps 香港服务器高防服务器首页云主机优惠云主机运维云主机推荐云主机资讯 Copyright © 2017-2026 BENJIYUN 豫ICP备17031040号-2

Python开展文字识别中的省份并绘图

介绍Cpca模块

基本使用

高级使用

相关推荐