正则表达式:为站内链接加上域名

本文涉及的产品
.cn 域名,1个 12个月
简介:

1、测试文本

1
2
3
4
5
6
7
< a  href='http://search/a.aspx'>home</ a >
 
< a  href='/aab/bb'>hello</ a >< a  href='http://www.sohu.com'>sohu</ a >< p >sdfsf</ p >
 
< a  href="/aab/bb">hello</ a >
< div >hello world</ div >
< a  href="aaa/bb"></ a >

 

2、为站内链接加上域名

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
using  System;
using  System.Collections.Generic;
using  System.Linq;
using  System.Text;
using  System.Text.RegularExpressions;
using  System.IO;
 
namespace  ConsoleApplication1
{
     class  Program
     {
         static  void  Main( string [] args)
         {
             string  s = File.ReadAllText( @"c:\a.txt" );
 
             //给所有非http的链接加上域名,链接前无/
             string  d = Regex.Replace(s,
                 @"<a\s+href\s?=\s?[\'|\""]((?!http)/.*)?[\""\']" ,
 
                 @"<a href=""www.cnblogs.com$1""" ,
 
                 RegexOptions.Compiled|RegexOptions.IgnoreCase);
 
             //给所有非http的链接加上域名,链接前有/
             string  e = Regex.Replace(d,
                 @"<a\s+href\s?=\s?[\'|\""]((?!http)(?!/).*)?[\""\']" ,
 
                 @"<a href=""www.cnblogs.com/$1""" ,
 
                 RegexOptions.Compiled | RegexOptions.IgnoreCase);
 
             // Console.WriteLine(d);
 
             Console.WriteLine(e);
 
             Console.Read();
 
         }
     }
}

a. 不包含http, (?!http)表示。

b. 非贪婪匹配 ?> 代表遇到第一个>匹配结束。

c. $1代表前面的组1.

d. 双引号在模式里\""

e. 双引号在@转义的字符串里用两个""表示.

本文转自敏捷的水博客园博客,原文链接http://www.cnblogs.com/cnblogsfans/archive/2010/01/24/1655121.html如需转载请自行联系原作者


王德水

相关文章
|
4月前
|
Python
"揭秘!Python如何运用神秘的正则表达式,轻松穿梭于网页迷宫,一键抓取隐藏链接?"
【8月更文挑战第21天】Python凭借其强大的编程能力,在数据抓取和网页解析领域表现出高效与灵活。通过结合requests库进行网页请求及正则表达式进行复杂文本模式匹配,可轻松提取网页信息。本示例展示如何使用Python和正则表达式解析网页链接。首先确保已安装requests库,可通过`pip install requests`安装。接着,利用requests获取网页内容,并使用正则表达式提取所有`&lt;a&gt;`标签的`href`属性。
57 0
|
1月前
|
存储 Kotlin
正则表达式在Kotlin中的应用:提取图片链接
正则表达式在Kotlin中的应用:提取图片链接
|
4月前
|
SQL 分布式计算 算法
【python】python指南(三):使用正则表达式re提取文本中的http链接
【python】python指南(三):使用正则表达式re提取文本中的http链接
46 0
|
5月前
|
开发框架 前端开发 JavaScript
若依怎样看开发文档,域名搜这个就行ruoyi.vip,建链接点击在线文档,有前端手册和后端手册,若依文档里有项目扩展,项目扩展有大量的开源的软件
若依怎样看开发文档,域名搜这个就行ruoyi.vip,建链接点击在线文档,有前端手册和后端手册,若依文档里有项目扩展,项目扩展有大量的开源的软件
|
7月前
|
存储 人工智能 算法
函数计算FC部署问题之域名链接链接访问失败如何解决
函数计算FC部署是指在阿里云Function Compute服务上部署函数或应用程序的过程,它提供了一个无需管理服务器即可运行代码的平台;本合集将介绍和总结函数计算FC部署中常见的问题与解决方案,指导用户如何高效部署和管理Serverless函数。
|
人工智能 小程序 算法
微信小程序正则表达式提取链接
问题 通过复制视频软件的链接会得到类似如下的内容(可见并不是纯文字的),已经打码解决办法 通过正则表达式: 1、新建方法get_url 2、调用即可 效果: 完整处理后: 好了,就到这里了
246 0
微信小程序正则表达式提取链接
|
移动开发 小程序 UED
web-view不配置业务域名不可以跳转外部链接
遇到需要项目跳转外部链接,想通过web-view跳转,但是发现打不开 经过查阅相关资料和进行相关测试,不配置业务域名这是无法实现的
164 0