正则表达式如何匹配中文

简介: 正则表达式如何匹配中文

1.jpg
\w匹配的仅仅是中文,数字,字母,对于国人来讲,仅匹配中文时常会用到,见下

匹配中文字符的正则表达式:

[\u4e00-\u9fa5]

或许你也需要匹配双字节字符,所谓“双字节字符”就是长度是两个字节(byte)的字符,比如“嗨”、“!”、“。”,汉字及中文标点就是双字节字符;“k”、“!”、“.”,英文字母及英文标点是单字节的。

匹配双字节字符(包括汉字在内):

[^\x00-\xff]

注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

目录
相关文章
|
8月前
正则表达式匹配中文
正则表达式匹配中文
74 1
正则表达式 - 中文、英文姓名匹配
正则表达式 - 中文、英文姓名匹配
3427 0
|
2月前
正则表达式如何匹配中文
正则表达式如何匹配中文
35 0
正则表达式开头提取前三个数字
正则表达式开头提取前三个数字
|
7月前
|
Java
正则表达式匹配数字的几种方法比较
正则表达式匹配数字的几种方法比较
正则表达式中的字符详解
正则表达式中的字符详解
102 1
|
8月前
探索正则表达式:强大文本匹配与处理工具
探索正则表达式:强大文本匹配与处理工具
正则表达式 - 最常用正则表达式大全(数字、字符、特殊)
正则表达式 - 最常用正则表达式大全(数字、字符、特殊)
936 0
|
C#
C#正则表达式的完全匹配、部分匹配及忽略大小写的问题
原文:C#正则表达式的完全匹配、部分匹配及忽略大小写的问题 问题的提出 根据用户给定表达式,里面含有各种数学函数,如求绝对值,三角函数,平方、开方等,分别以类似ABS(表达式),Sin(表达式),ASin(表达式),POW(表达式)等形式表述。
2026 0
|
Java
用正则表达式处理含中文字符串的问题
已经是第二次遇到同样的问题了,要匹配的字符串里含有中文,例如“<你好><Edward>”,我希望取出Edward的名字,所以正则表达式为“<[^>]*><([^>]*)>”,匹配后只要取group(1)即可。
1173 0