正则表达式如何匹配中文

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,内容安全 1000次 1年
对象存储 OSS,恶意文件检测 1000次 1年
简介: 正则表达式如何匹配中文

image.png

\w匹配的仅仅是中文,数字,字母,对于国人来讲,仅匹配中文时常会用到,见下

匹配中文字符的正则表达式:

[\u4e00-\u9fa5]

或许你也需要匹配双字节字符,所谓“双字节字符”就是长度是两个字节(byte)的字符,比如“嗨”、“!”、“。”,汉字及中文标点就是双字节字符;“k”、“!”、“.”,英文字母及英文标点是单字节的。

匹配双字节字符(包括汉字在内):

[^\x00-\xff]

注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

image.png

重要信息

image.png
image.png

目录
相关文章
|
5月前
正则表达式2
正则表达式
|
5月前
|
XML 数据格式
正则表达式3
正则表达式
|
6月前
正则表达式的使用
正则表达式的使用
47 1
|
6月前
|
自然语言处理 数据安全/隐私保护
正则表达式
正则表达式
44 0
正则表达式汇总
正则表达式汇总
46 0
|
人工智能 数据安全/隐私保护
一些常用的正则表达式
今天在写一些输入验证的时候用到了正则表达式,现在就回顾一下我们常用的正则表达式,对于正则表达式的写法很多种,看个人的习惯了,我的写法也许不是很好,但可以满足基本需求。
105 0
正则表达式(全)
正则表达式是由一些具有特殊含义的字符组成的字符串,多用于查找、替换符合规则的字符串。在表单验证、Url映射等处都会经常用到。
227 0
【正则表达式】总结
【正则表达式】总结
99 0
|
数据采集 Python
第63天:正则表达式
第63天:正则表达式
159 0