使用正则匹配并显示匹配的内容

简介: 最近在解析HTML文件,遇到这样的一个场景。我需要将HTML文件中data-url="xxx"中的xxx查找并显示出来。 首先考虑使用find,但是find只能显示包含查找内容的文件名,不符合场景的需要。

最近在解析HTML文件,遇到这样的一个场景。我需要将HTML文件中data-url="xxx"中的xxx查找并显示出来。

首先考虑使用find,但是find只能显示包含查找内容的文件名,不符合场景的需要。

接着考虑使用grep,配合-o参数,确实可以显示匹配到的内容,但是grep正则的时候,总是贪婪匹配,不能够最少匹配。如果非贪婪匹配,则需要使用GNU grep,命令如下:grep -o -P。但是Mac中的grep默认是BSD grep,所以这条路也走不通了。

最后,只有求助于perl的命令行方式来实现了,最后代码如下:

find www.maserati.com.cn -name *html -exec cat {} \; | perl -ne 'print $1 if /data-url=\"(http:\/\/.*?)\"/;'

 

相关文章
|
7月前
|
JavaScript 前端开发 Java
正则表达式深度解析:匹配任意字符串
【4月更文挑战第1天】
3388 0
|
5月前
|
数据采集 Java 数据处理
正则表达式替换技巧与实用案例分享
正则表达式替换技巧与实用案例分享
|
7月前
|
JavaScript 前端开发 Java
正则表达式深度解析:匹配制表符
【4月更文挑战第2天】
483 2
正则表达式深度解析:匹配制表符
|
7月前
|
Perl
sed删除不匹配正则表达式的行(保留匹配行)
sed删除不匹配正则表达式的行(保留匹配行)
675 2
|
7月前
|
Linux Perl
使用awk和正则表达式过滤文本或字符串 - 详细指南和示例
使用awk和正则表达式过滤文本或字符串 - 详细指南和示例
163 0
re 正则匹配 文本 特定内容
re 正则匹配 文本 特定内容
44 0
|
数据采集 开发者
|
程序员
学好正则表达式,啥难匹配的内容都给我匹配上
学好正则表达式,啥难匹配的内容都给我匹配上
|
移动开发
grep搜索字串包含特殊字符怎么办
grep搜索字串包含特殊字符怎么办
262 0
|
C#
C# -- 正则表达式匹配字符之含义
原文:C# -- 正则表达式匹配字符之含义 C#正则表达式匹配字符之含义 1.正则表达式的作用:用来描述字符串的特征。 2.各个匹配字符的含义: .   :表示除\n以外的单个字符 [ ]  :表示在字符数组[]中罗列出来的字符任意取单个 |   :表示“或”的意思 ()  :表示改变优...
1235 0