正则表达式如何匹配中文

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
文件存储 NAS,50GB 3个月
简介: 正则表达式如何匹配中文

image.png

\w匹配的仅仅是中文,数字,字母,对于国人来讲,仅匹配中文时常会用到,见下

匹配中文字符的正则表达式:

[\u4e00-\u9fa5]

或许你也需要匹配双字节字符,所谓“双字节字符”就是长度是两个字节(byte)的字符,比如“嗨”、“!”、“。”,汉字及中文标点就是双字节字符;“k”、“!”、“.”,英文字母及英文标点是单字节的。

匹配双字节字符(包括汉字在内):

[^\x00-\xff]

注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

image.png

重要信息

image.png
image.png

目录
打赏
0
0
0
0
225
分享
相关文章
正则表达式匹配
【10月更文挑战第8天】
|
10月前
|
10. 正则表达式匹配
10. 正则表达式匹配
59 0
|
10月前
使用正则表达式
使用正则表达式。
152 1
浅谈正则表达式的使用
在开发中,正则表达式的使用场景是多种多样的,同时也能够支持各种复杂场景,同时,正则表达式也是支持许多种语言,对于字符串的截取,匹配,替换 有着巨大的作用。
264 0
【小技巧】正则表达式
正则表达式小技巧 1 空行替换 ^\r\n
533 0
第177天:常用正则表达式(最全)
常用正则表达式 1 2 /* 常用正则表达式大全!(例如:匹配中文、匹配html) 3 4 匹配中文字符的正则表达式: [u4e00-u9fa5] 5 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 6 匹配双字节字符(包括汉字在内):[^x0...
1135 0
最全面的常用正则表达式大全
就算懂正则的朋友,在遇到需要用正则校验数据时,也往往是在网上去找很久,结果找来的还是不很符合要求。 所以我最近把开发中常用的一些正则表达式整理了一下,在这里分享一下。给自己留个底,也给朋友们做个参考。
1155 0
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等