PHP判断字符集并转码的函数

简介:

原理很简单,因为gb2312/gbk是中文两字节,这两个字节是有取值范围的,而utf-8中汉字是三字节,同样每个字节也有取值范围。而英文不 管在何种编码情况下,都是小于128,只占用一个字节(全角除外)。

如果是文件形式的编码检查,还可以直接check utf-8的BOM信息。话不多说,直接上函数,这个函数是用来对字符串进行检查和转码的。

Java代码   收藏代码
  1. <?php  
  2. function safeEncoding($string,$outEncoding ='UTF-8')      
  3. {      
  4.     $encoding = "UTF-8";      
  5.     for($i=0;$i<strlen($string);$i++)      
  6.     {      
  7.         if(ord($string{$i})<128)      
  8.             continue;      
  9.           
  10.         if((ord($string{$i})&224)==224)      
  11.         {      
  12.             //第一个字节判断通过      
  13.             $char = $string{++$i};      
  14.             if((ord($char)&128)==128)      
  15.             {      
  16.                 //第二个字节判断通过      
  17.                 $char = $string{++$i};      
  18.                 if((ord($char)&128)==128)      
  19.                 {      
  20.                     $encoding = "UTF-8";      
  21.                     break;      
  22.                 }      
  23.             }      
  24.         }      
  25.       
  26.         if((ord($string{$i})&192)==192)      
  27.         {      
  28.             //第一个字节判断通过      
  29.             $char = $string{++$i};      
  30.             if((ord($char)&128)==128)      
  31.             {      
  32.                 // 第二个字节判断通过      
  33.                 $encoding = "GB2312";      
  34.                 break;      
  35.             }      
  36.         }      
  37.     }      
  38.                
  39.     if(strtoupper($encoding) == strtoupper($outEncoding))      
  40.         return $string;      
  41.     else     
  42.         return iconv($encoding,$outEncoding,$string);      
  43. }  
  44. ?>  

 

Java代码   收藏代码
  1. /** 
  2.  * 将未知编码的字符串转换为期望的编码(配置文件中设置的编码) 
  3.  * @param unknown $str 
  4.  * @param string $toEncoding 
  5.  * @return string 
  6.  */  
  7. function convertStr($str, $toEncode = 'utf-8') {  
  8.     $charsetlist = array('ascii''gbk''gb2312''utf-8''big5');  
  9.     $strCode = mb_detect_encoding($str, $charsetlist);  
  10.   
  11.     if (strtolower($strCode) != strtolower($toEncode)) {  
  12.         $str = iconv($strCode, $toEncode, $str);  
  13.     }  
  14.   
  15.     return $str;  
  16. }  
相关文章
|
2月前
|
PHP 开发者
PHP计算过去一定时间段内日期范围函数
这个函数为开发者提供了一个快速而简单的方法来获取与当前日期相关的过去时间范围,代码简洁易懂,可复用性高。
120 15
|
4月前
|
PHP 开发者 索引
探究PHP中常见数组操作函数
在编码实践中,合理利用这些数组操作函数可以简化编程工作,提升代码的效率和可读性。为达到最佳实践,开发者应该通过阅读官方文档来深入理解每个函数的工作原理以及如何在不同的场景下运用它们。
186 8
php常见问题,php.ini文件不存在或者找不到,mb_strlen()函数未定义系列问题,dll模块找不到的解决
本文介绍了解决PHP常见问题的步骤,包括定位和创建`php.ini`文件,以及解决`mb_strlen()`函数未定义和DLL模块加载错误的具体方法。
php常见问题,php.ini文件不存在或者找不到,mb_strlen()函数未定义系列问题,dll模块找不到的解决
|
关系型数据库 MySQL 数据库连接
PHP内置函数
PHP内置函数
143 5
|
存储 API PHP
php学习笔记-php数组的创建和使用,数组常用函数-day03
关于PHP数组的创建、使用以及常用函数的详细学习笔记。
php学习笔记-php数组的创建和使用,数组常用函数-day03
|
Unix PHP 数据库
PHP日期和时间Date()函数获取当前时间
通过灵活运用 `date()`函数及其丰富的格式选项,PHP开发者可以轻松地在应用程序中处理和展示日期及时间信息。无论是需要精确到秒的完整时间戳,还是仅仅展示日期或时间的某一部分,`date()`函数都能胜任。理解并熟练应用这些格式化技巧,对于提升代码的可读性和维护性至关重要。
260 1
|
Linux PHP
Linux CentOS 宝塔 Suhosin禁用php5.6版本eval函数详细图文教程
【8月更文挑战第27天】本文介绍两种禁用PHP执行的方法:使用`PHP_diseval_extension`禁用和通过`suhosin`禁用。由于`suhosin`不支持PHP8,仅适用于PHP7及以下版本,若服务器安装了PHP5.6,则需对应安装`suhosin-0.9.38`版本。文章提供了详细的安装步骤,并强调了宝塔环境下与普通环境下的PHP路径差异。安装完成后,在`php.ini`中添加`suhosin.so`扩展并设置`executor.disable_eval = on`以禁用执行功能。最后通过测试代码验证是否成功禁用,并重启`php-fpm`服务生效。
396 2
|
JavaScript 前端开发 PHP
php学习笔记-php字符串及字符串常用函数总结-day04
本文总结了PHP中字符串的三种定义方式和常用字符串处理函数,包括字符串的修剪、转换、长度计算、子串操作、比较、连接、分割及替换等操作。
|
设计模式 存储 算法
PHP中的设计模式:策略模式的深入解析与应用在软件开发的浩瀚海洋中,PHP以其独特的魅力和强大的功能吸引了无数开发者。作为一门历史悠久且广泛应用的编程语言,PHP不仅拥有丰富的内置函数和扩展库,还支持面向对象编程(OOP),为开发者提供了灵活而强大的工具集。在PHP的众多特性中,设计模式的应用尤为引人注目,它们如同精雕细琢的宝石,镶嵌在代码的肌理之中,让程序更加优雅、高效且易于维护。今天,我们就来深入探讨PHP中使用频率颇高的一种设计模式——策略模式。
本文旨在深入探讨PHP中的策略模式,从定义到实现,再到应用场景,全面剖析其在PHP编程中的应用价值。策略模式作为一种行为型设计模式,允许在运行时根据不同情况选择不同的算法或行为,极大地提高了代码的灵活性和可维护性。通过实例分析,本文将展示如何在PHP项目中有效利用策略模式来解决实际问题,并提升代码质量。