开发者社区> 问答> 正文

php为什么会显示一个中文字符占3个呢?

phpstrlen
代码是这样的

 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>无标题文档</title>
</head>

<body>
<?php
$t='</br>';
$str='我心情很好';
echo strlen($str);
echo mb_strlen($str,'GBK');//后面跟上按那种编码测长
?>
</body>
</html>

我在浏览器看了下输出的是15和8,用什么浏览器都是,我又把中文字换成一个,结果输出的是3和2,搞不懂了有些,请大家指教哈

展开
收起
小旋风柴进 2016-03-09 11:15:01 3643 0
1 条回答
写回答
取消 提交回答
  • utf-8是3,gbk/gb2312是2
    PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节。例:

    $enStr = ‘Hello,China!’;
    echo strlen($enStr); // 输出:12

    而中文则不然,做中文网站一般会选择两种编码:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站长的喜爱。gbk与utf-8对中文的编码不同,导致中文在gbk与utf-8编码下所占字节也有差异。

    gbk编码下每个中文字符所占字节为2,例:

    $zhStr = ‘您好,中国!’;
    echo strlen($zhStr); // 输出:12

    utf-8编码下每个中文字符所占字节为3,例:

    $zhStr = ‘您好,中国!’;
    echo strlen($zhStr); // 输出:18

    那么如何计算这组中文字符串的长度呢?有人可能会说gbk下获取中文字符串长度除以2,utf-8编码下除以3不就行了吗?但是您要考虑字符串并不老实,99%的情况会以中英混合的情况出现。

    这是WordPress中的一段代码,主要思想就是先用正则将字符串分解为个体单元,然后再计算单元的个数即字符串的长度,代码如下(只能处理utf-8编码下的字符串):

    $zhStr = ‘您好,中国!’;
    $str = ‘Hello,中国!’;
    
    // 计算中文字符串长度
    function utf8_strlen($string = null) {
    // 将字符串分解为单元
    preg_match_all(“/./us”, $string, $match);
    // 返回单元个数
    return count($match[0]);
    }
    
    echo utf8_strlen($zhStr); // 输出:6
    echo utf8_strlen($str); // 输出:9
    2019-07-17 18:55:38
    赞同 展开评论 打赏
问答分类:
PHP
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
PHP 2017.北京 全球开发者大会——高可用的PHP 立即下载
PHP安全开发:从白帽角度做安全 立即下载
复杂PHP系统性能瓶颈排查及优化 立即下载