怎么用python正则表达式提取/匹配中文汉字

小编小本本 • 2023年4月17日 am8:00 • VPS运维

Python正则表达式匹配中文汉字

Python使用正则表达式匹配中文，只需要将中文的unicode字符串转换成utf-8格式即可，然后在re中随意调用。unicode中中文的编码为/u4e00-/u9fa5，因此正则表达式u”[u4e00-u9fa5]+”可以表示一个或者多个中文字符。

怎么用python正则表达式提取/匹配中文汉字

例如：

import re
s='中文：123456aa哈哈哈bbcc'.decode('utf8')
re.match(u"[u4e00-u9fa5]+", s)

正则表达式匹配中文汉字方法

正则表达式匹配中文汉字在实际应用中十分常见，例如爬虫网页文本提取、验证用户输入标准等。以下面文本字符串为例，介绍两种方法实现匹配的代码：

方法一：

import re
astr='aaaaa何时when杖尔看see南雪snow，我me与梅花plum blossom两白头'
res=re.findall('[u4e00-u9fa5]',astr)
print(res)

方法二：

import re
astr='aaaaa何时when杖尔看see南雪snow，我me与梅花plum blossom两白头'
res=re.findall('[一-龥]',astr)
print(res)

注：其实这里“一”对应的Unicode编码就是“u4e00”，“龥”（yù）对应的Unicode编码就是“u9fa5”。常见非英文字符Unicode编码范围：u4e00-u9fa5（中文）、u0800-u4e00（日文）、uac00-ud7ff（韩文）。

综上所述，本文介绍了Python正则表达式匹配中文汉字的方法，希望对大家有所帮助。

原创文章，作者：小编小本本，如若转载，请注明出处：https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/7206.html

赞 (0)

小编小本本

python绘制神器五角星+小黄人+樱花方法介绍

« 上一篇 2023年4月17日 am8:00

彻底弄懂Python中的调用函数(callback)

下一篇 » 2023年4月17日 am8:00

VPS运维

Mysql5.7版本主主搭建

主主搭建原理 MySQL主主搭建是指将两台MySQL服务器互为主从的过程。在主从搭建完成后，即可进行主主配置。本文假设环境已经完成主从搭建，主MySQL服务器IP地址为192.16…

2023年4月19日
VPS运维

做外贸用什么软件翻译(做外贸的，哪些软件最实用？)

外贸软件选择的考虑因素出口外贸软件不同于杀毒软件之类的工具软件，软件开发商能否持续提供良好的维护和升级，是购买管理软件时首先要考虑的问题。根据数据，软件企业的年淘汰率在15%左右…

2023年4月18日
VPS运维

ogg同步数据到kafka案例简介

ogg同步数据到kafka案例简介作为一个oggers，我们经常需要进行数据的同步，而大部分情况下是RDBMS之间的同步，例如oracle到oracle,oracle到mysql…

2023年4月16日
VPS运维

搭建Pythonargv的4种比较常见方式方法

序言大家好，我是本际云服务器推荐网的小编小本本。在Python脚本制作过程中，我们通常需要使用argv传递参数，方便灵活。本文将介绍4种常见的Python argv搭建方法，详细…

2023年4月16日
VPS运维

基于AMP平台实现MySQL双主高可用部署

基于AMP平台实现MySQL双主高可用部署我是本际云服务器推荐网的小编小本本，作为运维人员，在日常工作中，我们经常需要满足客户业务端的MySQL安装需求并要求其具备高可用能力，这…

2023年4月15日
VPS运维

Prometheus+Grafana监控Docker容器

监控系统部署作为容器运维人员，我们需要选择和部署适合自己的监控系统，以及灵活运用各种监控指标数据和告警规则，提高容器资源利用率和应用性能。监控系统概述 cAdvisor（Con…

2023年4月15日
VPS运维

重建standby

重建standby 本文是本际云服务器推荐网的小编小本本，为大家介绍如何重建standby。在进行操作前，需要首先备份环境变量。可以使用以下命令：cp .bashrc .bash…

2023年4月17日
VPS运维

the-clean-architecture

系统架构我是本际云服务器推荐网的小编小本本。过去几年，我们已经看到了一系列关于系统架构的想法，包括：六边形架构（接口与适配器）、洋葱架构（Onion Architecture）、…

2023年4月17日
VPS运维

Nginx多站点配置，实现虚拟主机（附：简单步骤）

背景介绍随着互联网的不断发展和应用范围的不断扩大，网站也越来越多，如何同时管理和维护多个网站成为了网站管理员的重要工作之一。Nginx是一款高性能的Web服务器，同时也是一款反向…

2023年4月19日
VPS运维

TiDB集群在线服务器停机维护主机资源

TiDB集群在线服务器停机维护主机资源本文将为大家介绍TiDB集群在线服务器停机维护主机资源方案。 TiDB集群在线服务器维护流程在业务需求逐步增长的情况下，单台虚拟服务器的资…

2023年4月19日