RegeX使用教程

简介:

RegeX简介及下载:http://www.cnblogs.com/SkyD/archive/2008/09/22/1295621.html

作为本文的读者,你最好具有一点正则表达式的知识,我将通过一个简单的正则表达式应用范例,向你展示RegeX的用途:

网页标准化已经不是什么新鲜事了,XHTML允许程序像访问XML一样访问其内容,这很激动人心。

不幸的是,网上仍然大量充斥着不遵循XHTML标准的网页,这使得上述优势大打折扣,好在我们可以在读取前尝试对网页进行一些修正,今天我们的范例就是修正工作中的一项——增加双引号。

打开很多旧网页的源代码,你就会看到诸如“ width=6 ”这样的属性设定,我们的目标就是把它们修正为“ width="6" ”。

下面打开RegeX,导入或粘贴入要处理的网页代码,在“表达式”栏输入如下表达式:

(?<=\s)(?<property>\w+)=(?<value>[^"\s<>]+?)(?=[\s>])

然后点击“检索匹配成功的字符”按钮,即可看到类似下图的界面:


可以看到,受表达式匹配的字符串被用两种颜色交替高亮显示了,这些正是我们要处理的东西。 

显然这个网页的生成程序是跨越了两个时代的了,属性设定语句有些符合标准,有些不符合,依托高亮显示功能,我们才得以如此清晰地看到这些。 

接下来在“替换为”一栏输入以下字符:

${property}: ${value}

以及一个回车符,这样才能保证替换后的每项都处于独立行中。

现在点击“替换并删除其他字符”按钮,将会是下面这样:


啊哈,所有需要修改的项都列出来了。

这是一种一切了如指掌的感觉,你甚至可以导出一个文本发给BOSS来炫耀你的功绩,当然,如果他是小白的话。

然后就是正式的修正操作了,把“替换为”一栏的内容全部清楚,记得回车符也要删掉,然后输入下面的字符:

${property}="${value}"

点击“替换并保留其他字符”按钮:

 

这样修正工作就完成了,而且你可以清楚地看到你所修改的一切,检查无误之后导出就OK啦。


本文转自斯克迪亚博客园博客,原文链接:http://www.cnblogs.com/SkyD/archive/2008/09/22/1295620.html,如需转载请自行联系原作者

相关文章
|
Java
正则表达式基本使用
正则表达式基本使用
602 0
正则表达式基本使用
|
C++ Windows Perl
[笔记]c++基础实践《二》regex正则表达式
[笔记]c++基础实践《二》regex正则表达式
|
Java Unix API
Kotlin:正则Regex原来这么方便
Regex相对于Java的Api来说,使用起来更加的简单,如果大家在非正则的功能使用时,比如寻找,替换,是否包含等等,完全可以使用字符串自带的功能即可,如果说要实现一些较为复杂的,比如邮箱的验证,手机号的验证等等,那么Regex绝对是你的首选。
314 0
Kotlin:正则Regex原来这么方便
|
人工智能 JSON IDE
正则表达式教程:实例速查
正则表达式(regex 或 regexp)在文本信息提取方面是非常有用的工具
434 0
Elastic Search 新手笔记(2)—— 日期格式
前言 前一阵子,做了elasticsearc相关的工作,遇到了日期格式的问题,苦于当时找了好久,所以在这里记录一下。 正文 首先在这里贴出官方的讲解,官网永远是最好的老师。Elasticsearch 官网日期格式官网是英语的,很多人看着头大,那么可以直接看下面的表格。
2804 0
|
数据格式 XML