微软面试题:正则表达式提取链接地址

简介:

写出正则表达式,从一个字符串中提取链接地址。比如下面字符串中 
"IT面试题博客中包含很多  <a href=http://hi.baidu.com/mianshiti/blog/category/微软面试题> 微软面试题 </a> " 
则需要提取的地址为 " http://hi.baidu.com/mianshiti/blog/category/微软面试题 "

在python中: 
import re 
p = re.compile('<a(?: [^>]*)+href=([^ >]*)(?: [^>]*)*>') 
content = "IT面试题博客中包含很多 <a href=http://hi.baidu.com/mianshiti/blog/category/微软面试题> 微软面试题 </a> " 
p.search(content).groups() 
这段代码对于给出的例子是足够了,但实际情况中还需要考虑链接地址两边的单引号或者双引号,href的大小写,情况会稍微复杂些。 
另外,如果面试者对正则表达式完全没有概念,可以和面试官申请换一道题,一般不会有太大影响。 
参考资料: 
http://wiki.ubuntu.org.cn/Python正则表达式操作指南


目录
相关文章
|
2月前
|
网络协议 JavaScript 前端开发
使用正则表达式验证身份证号、QQ号、手机号、邮箱、地址、邮编、银行卡号、学号、车牌号、快递单号、验证码、ISBN号、网址、IPV4地址、IPV6地址、出生年月日、姓名2
使用正则表达式验证身份证号、QQ号、手机号、邮箱、地址、邮编、银行卡号、学号、车牌号、快递单号、验证码、ISBN号、网址、IPV4地址、IPV6地址、出生年月日、姓名
941 0
|
JavaScript 网络协议 前端开发
IP地址(IPv4)/IPv6地址的正则表达式
原地址:http://pfeishao.blog.163.com/blog/static/18162337020112113130453/ Pv4地址正则表达式:^((25[0-5]|2[0-4]\d|[01]?\d\d?)\.
16515 0
|
Web App开发 Shell
72、shell正则表达式判断ip地址
1、表达式书写:[2] regex_ip="(2[0-4][0-9]|25[0-5]|1[0-9][0-9]|[1-9]?[0-9])(\.(2[0-4][0-9]|25[0-5]|1[0-9][0-9]|[1-9]?[0-9])){3}" 意思是 (0-255)(点号  0-255)3次 echo "123.
1451 0
|
Web App开发 PHP
PHP正则表达式获取指定IP的物理地址
  网站常用的模块可能出了注册、登陆、发稿、留言、评论,剩下比较重要的也许就是获取IP并作相应的数据处理了。自己搭建IP数据库占资源,而且更新不便,何不使用现成的IP查询呢?下面自己写了个获取IP物理地址的PHP代码(有一定的瑕疵,请高手不吝赐教)Venus'Blog   DOCTYPE html>     这段代码采用访问http://www.ip138.com后使用正则表达式进行截取部分内容,Venus'Blog其中正则表达式是自己写的。
1300 0
|
JavaScript 前端开发
【JavaScript】不使用正则表达式和字符串的方式来解析浏览器的URl地址信息
版权声明:本文为博主原创文章,未经博主允许不得转载。更多学习资料请访问我爱科技论坛:www.52tech.tech https://blog.csdn.net/m0_37981569/article/details/82532501 1.
1028 0
|
Java
java使用正则表达式判断手机号,固定电话,身份证,邮箱,url,车牌号,日期,ip地址,mac,人名等
版权声明:本文为博主原创文章,如需转载,请标明出处。 https://blog.csdn.net/alan_liuyue/article/details/78983474 简介   1.
4174 0