开发者社区> 科技探索者> 正文

10个实用的PHP正则表达式

简介:
+关注继续查看

来自于:http://wysafe.com/blog/2622.html


正则表达式是程序开发中一个重要的元素,它提供用来描述或匹配文本的字符串,如特定的字符、词或算式等。但在某些情况下,用正则表达式去验证一个字符串比较复杂和费时。本文为你介绍10种常见的实用PHP正则表达式的写法,希望对你的工作有所帮助。


1. 验证E-mail地址

if (filter_var('test+email@ansoncheung', FILTER_VALIDATE_EMAIL)) { echo "Your email is ok.";} else { echo "Wrong email address format.";}

2. 验证用户名

  1. $username = "user_name12";if (preg_match('/^[a-z\d_]{5,20}$/i', $username)) { echo "Your username is ok.";} else { echo "Wrong username format.";}

说明:这是一个用于验证用户名的实例,其中包括字母、数字(A-Z,a-z,0-9)、下划线以及最低5个字符,最大20个字符。同时,也可以根据需要,对最小值和最大值做合理的修改。

3. 验证电话号码

$phone = "(021)423-2323";if (preg_match('/\(?\d{3}\)?[-\s.]?\d{3}[-\s.]\d{4}/x', $phone)) { echo "Your phone number is ok.";} else { echo "Wrong phone number.";}

--一个验证美国电话号码的实例

4. 验证IP地址

$IP = "198.168.1.78";if (preg_match('/^(([1-9]?[0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]).){3}([1-9]?[0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])$/',$IP)) { echo "Your IP address is ok.";} else { echo "Wrong IP address.";}

5. 验证邮政编码

$zipcode = "12345-5434"; if (preg_match("/^([0-9]{5})(-[0-9]{4})?$/i",$zipcode)) { echo "Your Zip code is ok."; } else { echo "Wrong Zip code."; }

6. 验证SSN(社会保险号)

$ssn = "333-23-2329";if (preg_match('/^[\d]{3}-[\d]{2}-[\d]{4}$/',$ssn)) { echo "Your SSN is ok.";} else { echo "Wrong SSN.";}

7. 验证信用卡号

$cc = "378282246310005";if (preg_match('/^(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|6011[0-9]{12}|3(?:0[0-5]|[68][0-9])[0-9]{11}|3[47][0-9]{13})$/', $cc)) { echo "Your credit card number is ok.";} else { echo "Wrong credit card number.";}

8. 验证域名

$url = "http://ansoncheung.tk/"; if (preg_match('/^(http|https|ftp):\/\/([A-Z0-9][A-Z0-9_-]*(?:\.[A-Z0-9][A-Z0-9_-]*)+):?(\d+)?\/?/i', $url)) { echo "Your url is ok."; } else { echo "Wrong url."; }

9. 从特定URL中提取域名

$url = "http://ansoncheung.tk/articles"; preg_match('@^(?:http://)?([^/]+)@i', $url, $matches); $host = $matches[1];echo $host;

10. 将文中关键词高亮显示

$text = "Sample sentence from AnsonCheung.tk, regular expression has become popular in web programming. Now we learn regex. According to wikipedia, Regular expressions (abbreviated as regex or regexp, with plural forms regexes, regexps, or regexen) are written in a formal language that can be interpreted by a regular expression processor";$text = preg_replace("/\b(regex)\b/i", '<span style="background:#5fc9f6">\1</span>', $text);echo $text;

这次从wysafe转载过来,没有进行验证,以后用到这些了,再添加自己 的使用感受.



8个开发必备的PHP功能


  做过PHP开发的程序员应该清楚,PHP中有很多内置的功能,掌握了它们,可以帮助你在做PHP开发时更加得心应手,本文将分享8个开发必备的PHP功能,个个都非常实用,希望各位PHP开发者能够掌握。


1、传递任意数量的函数参数

我们在.NET或者JAVA编程中,一般函数参数个数都是固定的,但是PHP允许你使用任意个数的参数。下面这个示例向你展示了PHP函数的默认参数:


  1. // 两个默认参数的函数function foo($arg1 = ", $arg2 = ") {echo "arg1: $arg1\n";echo "arg2: $arg2\n";}foo(&lsquo;hello&rsquo;,'world&rsquo;); /* 输出:arg1: hello arg2: world */foo(); /* 输出:arg1: arg2: */

下面这个示例是PHP的不定参数用法,其使用到了?func_get_args()方法:


  1. // 是的,形参列表为空function foo() {// 取得所有的传入参数的数组$args = func_get_args();foreach ($args as $k => $v) { echo "arg".($k+1).": $v\n"; }}foo(); /* 什么也不会输出 */foo(&lsquo;hello&rsquo;); /* 输出arg1: hello */foo(&lsquo;hello&rsquo;, &lsquo;world&rsquo;, &lsquo;again&rsquo;); /* 输出arg1: hello arg2: world arg3: again */
2、使用glob()查找文件

大部分PHP函数的函数名从字面上都可以理解其用途,但是当你看到?glob() 的时候,你也许并不知道这是用来做什么的,其实glob()和scandir() 一样,可以用来查找文件,请看下面的用法:


  1. // 取得所有的后缀为PHP的文件$files = glob(&lsquo;*.php&rsquo;);print_r($files); /* 输出:Array ( [0] => phptest.php [1] => pi.php [2] => post_output.php [3] => test.php ) */

你还可以查找多种后缀名


  1. // 取PHP文件和TXT文件$files = glob(&lsquo;*.{php,txt}&rsquo;, GLOB_BRACE);print_r($files); /* 输出:Array ( [0] => phptest.php [1] => pi.php [2] => post_output.php [3] => test.php [4] => log.txt [5] => test.txt ) */

你还可以加上路径:


  1. $files = glob(&lsquo;../images/a*.jpg&rsquo;);print_r($files); /* 输出:Array ( [0] => ../images/apple.jpg [1] => ../images/art.jpg ) */

如果你想得到绝对路径,你可以调用?realpath() 函数:


  1. $files = glob(&lsquo;../images/a*.jpg&rsquo;);// applies the function to each array element $files = array_map(&lsquo;realpath&rsquo;,$files);print_r($files); /* output looks like: Array ( [0] => C:\wamp\www\images\apple.jpg [1] => C:\wamp\www\images\art.jpg ) */
3、获取内存使用情况信息

PHP的内存回收机制已经非常强大,你也可以使用PHP脚本获取当前内存的使用情况,调用memory_get_usage() 函数获取当期内存使用情况,调用memory_get_peak_usage() 函数获取内存使用的峰值。参考代码如下:


  1. echo "Initial: ".memory_get_usage()." bytes \n"; /* 输出Initial: 361400 bytes */// 使用内存for ($i = 0; $i < 100000; $i++) { $array []= md5($i); }// 删除一半的内存for ($i = 0; $i < 100000; $i++) { unset($array[$i]); }echo "Final: ".memory_get_usage()." bytes \n"; /* prints Final: 885912 bytes */echo "Peak: ".memory_get_peak_usage()." bytes \n"; /* 输出峰值Peak: 13687072 bytes */
4、获取CPU使用情况信息

获取了内存使用情况,也可以使用PHP的getrusage()获取CPU使用情况,该方法在windows下不可用。


  1. print_r(getrusage()); /* 输出Array ( [ru_oublock] => 0 [ru_inblock] => 0 [ru_msgsnd] => 2 [ru_msgrcv] => 3 [ru_maxrss] => 12692 [ru_ixrss] => 764 [ru_idrss] => 3864 [ru_minflt] => 94 [ru_majflt] => 0 [ru_nsignals] => 1 [ru_nvcsw] => 67 [ru_nivcsw] => 4 [ru_nswap] => 0 [ru_utime.tv_usec] => 0 [ru_utime.tv_sec] => 0 [ru_stime.tv_usec] => 6269 [ru_stime.tv_sec] => 0 )*/

这个结构看上出很晦涩,除非你对CPU很了解。下面一些解释:

  • ru_oublock: 块输出操作
  • ru_inblock: 块输入操作
  • ru_msgsnd: 发送的message
  • ru_msgrcv: 收到的message
  • ru_maxrss: 最大驻留集大小
  • ru_ixrss: 全部共享内存大小
  • ru_idrss:全部非共享内存大小
  • ru_minflt: 页回收
  • ru_majflt: 页失效
  • ru_nsignals: 收到的信号
  • ru_nvcsw: 主动上下文切换
  • ru_nivcsw: 被动上下文切换
  • ru_nswap: 交换区
  • ru_utime.tv_usec: 用户态时间 (microseconds)
  • ru_utime.tv_sec: 用户态时间(seconds)
  • ru_stime.tv_usec: 系统内核时间 (microseconds)
  • ru_stime.tv_sec: 系统内核时间?(seconds)

要看到你的脚本消耗了多少CPU,我们需要看看”用户态的时间”和”系统内核时间”的值。秒和微秒部分是分别提供的,您可以把微秒值除以100万,并把它添加到秒的值后,可以得到有小数部分的秒数。


  1. // sleep for 3 seconds (non-busy) sleep(3);$data = getrusage(); echo "User time: ". ($data['ru_utime.tv_sec'] + $data['ru_utime.tv_usec'] / 1000000); echo "System time: ". ($data['ru_stime.tv_sec'] + $data['ru_stime.tv_usec'] / 1000000);/* 输出User time: 0.011552 System time: 0 */

sleep是不占用系统时间的,我们可以来看下面的一个例子:


  1. // loop 10 million times (busy) for($i=0;$i<10000000;$i++) {}$data = getrusage(); echo "User time: ". ($data['ru_utime.tv_sec'] + $data['ru_utime.tv_usec'] / 1000000); echo "System time: ". ($data['ru_stime.tv_sec'] + $data['ru_stime.tv_usec'] / 1000000);/* 输出User time: 1.424592 System time: 0.004204 */

这花了大约14秒的CPU时间,几乎所有的都是用户的时间,因为没有系统调用。

系统时间是CPU花费在系统调用上的上执行内核指令的时间。下面是一个例子:


  1. $start = microtime(true); // keep calling microtime for about 3 seconds while(microtime(true) &ndash; $start < 3) {}$data = getrusage(); echo "User time: ". ($data['ru_utime.tv_sec'] + $data['ru_utime.tv_usec'] / 1000000); echo "System time: ". ($data['ru_stime.tv_sec'] + $data['ru_stime.tv_usec'] / 1000000);/* prints User time: 1.088171 System time: 1.675315 */

我们可以看到上面这个例子更耗CPU。

5、获取系统常量

PHP 提供非常有用的系统常量 可以让你得到当前的行号 (__LINE__),文件 (__FILE__),目录 (__DIR__),函数名 (__FUNCTION__),类名(__CLASS__),方法名(__METHOD__) 和名字空间 (__NAMESPACE__),很像C语言。

我们可以以为这些东西主要是用于调试,当也不一定,比如我们可以在include其它文件的时候使用?__FILE__ (当然,你也可以在 PHP 5.3以后使用 __DIR__ ),下面是一个例子。


  1. // this is relative to the loaded script&rsquo;s path // it may cause problems when running scripts from different directories require_once(&lsquo;config/database.php&rsquo;);// this is always relative to this file&rsquo;s path // no matter where it was included from require_once(dirname(__FILE__) . &lsquo;/config/database.php&rsquo;);

下面是使用 __LINE__ 来输出一些debug的信息,这样有助于你调试程序:


  1. // some code // …my_debug("some debug message", __LINE__); /* 输出Line 4: some debug message */// some more code // …my_debug("another debug message", __LINE__); /* 输出Line 11: another debug message */function my_debug($msg, $line) { echo "Line $line: $msg\n"; }
6、生成唯一的id

很多朋友都利用md5()来生成唯一的编号,但是md5()有几个缺点:1、无序,导致数据库中排序性能下降。2、太长,需要更多的存储空间。其实PHP中自带一个函数来生成唯一的id,这个函数就是uniqid()。下面是用法:


  1. // generate unique string echo uniqid(); /* 输出4bd67c947233e */// generate another unique string echo uniqid(); /* 输出4bd67c9472340 */

该算法是根据CPU时间戳来生成的,所以在相近的时间段内,id前几位是一样的,这也方便id的排序,如果你想更好的避免重复,可以在id前加上前缀,如:


  1. // 前缀echo uniqid(&lsquo;foo_&rsquo;); /* 输出foo_4bd67d6cd8b8f */// 有更多的熵echo uniqid(",true); /* 输出4bd67d6cd8b926.12135106 */// 都有echo uniqid(&lsquo;bar_&rsquo;,true); /* 输出bar_4bd67da367b650.43684647 */
7、序列化

PHP序列化功能大家可能用的比较多,也比较常见,当你需要把数据存到数据库或者文件中是,你可以利用PHP中的serialize() 和 unserialize()方法来实现序列化和反序列化,代码如下:


  1. // 一个复杂的数组$myvar = array(&lsquo;hello&rsquo;,42, array(1,&rsquo;two&rsquo;),&lsquo;apple&rsquo;);// 序列化$string = serialize($myvar);echo $string; /* 输出a:4:{i:0;s:5:"hello";i:1;i:42;i:2;a:2:{i:0;i:1;i:1;s:3:"two";}i:3;s:5:"apple";} */// 反序例化$newvar = unserialize($string);print_r($newvar); /* 输出Array ( [0] => hello [1] => 42 [2] => Array ( [0] => 1 [1] => two )[3] => apple ) */

如何序列化成json格式呢,放心,php也已经为你做好了,使用php 5.2以上版本的用户可以使用json_encode() 和 json_decode() 函数来实现json格式的序列化,代码如下:


  1. // a complex array $myvar = array(&lsquo;hello&rsquo;,42, array(1,&rsquo;two&rsquo;),&lsquo;apple&rsquo;);// convert to a string $string = json_encode($myvar);echo $string; /* prints ["hello",42,[1,"two"],"apple"] */// you can reproduce the original variable $newvar = json_decode($string);print_r($newvar); /* prints Array ( [0] => hello [1] => 42 [2] => Array ( [0] => 1 [1] => two )[3] => apple ) */
8、字符串压缩

当我们说到压缩,我们可能会想到文件压缩,其实,字符串也是可以压缩的。PHP提供了?gzcompress() 和 gzuncompress() 函数:


  1. $string ="Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nunc ut elit id mi ultricies adipiscing. Nulla facilisi. Praesent pulvinar, sapien vel feugiat vestibulum, nulla dui pretium orci, non ultricies elit lacus quis ante. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Aliquam pretium ullamcorper urna quis iaculis. Etiam ac massa sed turpis tempor luctus. Curabitur sed nibh eu elit mollis congue. Praesent ipsum diam, consectetur vitae ornare a, aliquam a nunc. In id magna pellentesque tellus posuere adipiscing. Sed non mi metus, at lacinia augue. Sed magna nisi, ornare in mollis in, mollis sed nunc. Etiam at justo in leo congue mollis. Nullam in neque eget metus hendrerit scelerisque eu non enim. Ut malesuada lacus eu nulla bibendum id euismod urna sodales. ";$compressed = gzcompress($string);echo "Original size: ". strlen($string)."\n"; /* 输出原始大小Original size: 800 */echo "Compressed size: ". strlen($compressed)."\n"; /* 输出压缩后的大小Compressed size: 418 */// 解压缩$original = gzuncompress($compressed);

几乎有50% 压缩比率。同时,你还可以使用?gzencode() 和 gzdecode() 函数来压缩,只不用其用了不同的压缩算法。

以上就是8个开发必备的PHP功能,是不是都很实用呢?

本文转自孤舟夜航之家博客51CTO博客,原文链接http://blog.51cto.com/cysky/1413040如需转载请自行联系原作者


cysky

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
14220 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
28082 0
扩大php的正则表达式preg_match的长度限制
对一些字符比较多的站点进行采集时,用到了preg_match、preg_match_all,但是发现正则会失效。 有两种修改方法: 1、ini_set('pcre.backtrack_limit', 1000000); //默认的只有100000 2、修改 php.ini 的pcre.backtrack_limit参数,使之支持更大的字符串。
847 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
20159 0
PHP正则表达式入门教程[转]
思维导图 点击下图,可以看具体内容!     介绍          正则表达式,大家在开发中应该是经常用到,现在很多开发语言都有正则表达式的应用,比如javascript,java,.
1041 0
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
23538 0
5488
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
JS零基础入门教程(上册)
立即下载
性能优化方法论
立即下载
手把手学习日志服务SLS,云启实验室实战指南
立即下载