开发者社区> wangtaotao> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

注册用户名字符长度判断细节

简介: $username = '刷_单8元1单淘宝客服20元1小时_我Q125556733jff';        var_dump(strlen($username));        var_dump(Library\Common::username_patten($username));   一、使用strlen来判断长度   里面的一个汉字会认为长度是3个字符(utf-8编码情况下一个汉字3个字符,gbk编码就是2个字符长度) 例子:  $username = '刷_单8元';  var_dump(strlen($username));   长度是11。
+关注继续查看

        $username = '刷_单8元1单淘宝客服20元1小时_我Q125556733jff';
        var_dump(strlen($username));
        var_dump(Library\Common::username_patten($username));

 

一、使用strlen来判断长度

 

里面的一个汉字会认为长度是3个字符(utf-8编码情况下一个汉字3个字符,gbk编码就是2个字符长度)

例子:

 $username = '刷_单8元';
  var_dump(strlen($username));

 

长度是11。

 

刷,单,元  3*3=9

"_“和"8", 总共是2个长度

9+2=11

 

具体做试验:

$username = '刷';

var_dump(strlen($username));//得到是长度值是3

 

二、使用正则匹配

         $username_patten = '/^[a-zA-Z0-9_\x{4e00}-\x{9fa5}]{3,30}$/u'; //字母、数字、下划线、中文,汉字或字符加起来30个即可
        //注:\x{4e00}-\x{9fa5}作为汉字的范围判断只适合utf-8编码情况下,gb2312不适合目前我们的项目统一使用utf8项目。

        if (preg_match($username_patten, $username)){

 

 

        }

 

特点:正则中会把一个汉字当成一个长度来计算。因为\x{4e00}已经指定了汉字编码

 

解释不是非常科学。记住这个细节的差异就可以了。

 

javascript的验证长度研究

 

/*
 * +---------------------------------
 * 验证指定的字符长度,用来做标题长度验证
 * +---------------------------------
 */
function getStrLeng(str){
    
    var len = str.length;//js内部使用的是utf16编码,如果是中文,一个汉字也算一个长度。所以返回的是字符长度,而不是字节大小
    return len;
    
}
var len = getStrLeng("我们_j");//在js中,一个中文汉str.length字也是一个长度,
/*
 JavaScript中的String内部表示方式始终是UTF16,而它的length也是始终按UTF16 code point去计算,简而言之,length始终返回字符数量,而非字节大小!
 为什么有人测试发现对于同一个字符串"张三",用UTF8编码时返回2,用GBK则得到3呢?那是因为浏览器没能正确识别文件编码,所以判断错了,返回3的结果是一个程序运行出错的结果。
 参考:
 http://segmentfault.com/q/1010000000445715
 因为使用的是utf-16,所以这个编码表里面能够找到所有的汉字,这样情况下,就能够当成一个字符了?
 反正它返回的不是实际的字节长度,而是多少个字符。
 
 http://www.puritys.me/docs-blog/article-107-String-Length-%E4%B8%AD%E6%96%87%E5%AD%97%E4%B8%B2%E9%95%B7%E5%BA%A6.html
 
 使用 string.length 來計算長度時,中文字串會被當成是一個字來計算,因為 Javascript 是使用 multiple byte 計算,就像是 php 的 mb_strlen。
 不管是中文,英文,都當成一個字來算,所以總共是 6 個字,不過有時候我們並不想把中文字當成一個字來計算,因為中文字明明佔的 byte 數就是比較多,所以來看一下中文編碼吧。
*/


alert(len);



/*
 * +---------------------------------
 * 验证指定的字符长度,用来做标题长度验证
 * 这个函数验证是按照字节长度算,所以中文汉字在utf-8编码中是算3个字节
 * +---------------------------------
 */
function getStrLengByBytle(str){
    
    
}

 

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
有一个长度是10的数组,数组内有10个人名,要求去掉重复的人名,并输出
有一个长度是10的数组,数组内有10个人名,要求去掉重复的人名,并输出
0 0
根据ASCII值的数字和与某一数字的大小关系,判断是否成功输入密码
根据ASCII值的数字和与某一数字的大小关系,判断是否成功输入密码
0 0
正则校验密码包含字母数字符号
正则校验密码包含字母数字符号
0 0
后台生成一个随机的英文与数字组合的验证码
后台生成一个随机的英文与数字组合的验证码
0 0
正则表达式--密码复杂度验证--必须包含大写、小写、数字、特殊字符中的至少三项
正则表达式--密码复杂度验证--必须包含大写、小写、数字、特殊字符中的至少三项
0 0
C#中判断一个字符串是不是包含非法字符
方法一:(正则表达式)         /*         * @author 李效伦         *          * 判断一个字符串是不是合法         */            public bool Islegal()        {            Rege...
711 0
[转帖]C#如何使用正则表达式来校验字段串输入的系列函数
C#如何使用正则表达式来校验字段串输入的系列函数 #region 输入字段串校验系列函数  ///   ///获得字符串长度   ///   ///   ///   public static int GetStrLength(string str)  {   byte[] sarr = System.Text.Encoding.Default.GetBytes(str);   return sarr.Length;  }   ///   ///返回指定长度字符串。
644 0
+关注
wangtaotao
专注于互联网系统设计
文章
问答
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载