正则表达式与运用

简介: 正则表达式用的地方是很多的。比如字符串处理过程中。最近遇到记录一下。1. 比如在shell中1 #!/bin/bash2 3 str="date:2017-11-28 os:centos blackbord:blog"4 5 echo $str | grep centos --colo...

正则表达式用的地方是很多的。比如字符串处理过程中。最近遇到记录一下。

1. 比如在shell中

1 #!/bin/bash
2 
3 str="date:2017-11-28 os:centos blackbord:blog"
4 
5 echo $str | grep centos --color
6 echo $str | grep -oE centos --color
7 #组的使用
8 echo $str | sed -rne 's/.*(date:[0-9]{4}-[0-9]{2}-[0-9]{2}).*(blackbord:[a-z]+).*/group:\1 group:\2/p'

执行输出:

1 date:2017-11-28 os:centos blackbord:blog
2 centos
3 group:date:2017-11-28 group:blackbord:blog

2. Python中

 1 #coding=utf-8
 2 import re
 3 
 4 str1="line:20 date(2017-11-28) os:centos blackbord[blog] last"
 5 
 6 matchobj = re.search("(date\(\d+-\d+-\d+\)).*(os:[a-z]+).*(blackbord\[[a-z]+\])", str1)
 7 if matchobj:
 8     num = len(matchobj.groups())
 9     print "match_len:" + str(num)
10     print matchobj.groups()
11 
12     date = matchobj.group(1)    #date(2017-11-28)
13     date = date[5:len(date)-1]
14     os = matchobj.group(2)  #os:centos
15     os = os[3:]
16     blackbord = matchobj.group(3)   #blackbord[blog]
17     blackbord = blackbord[10:len(blackbord) -1 ]
18     print("date:%s\nos:%s\nblackbord:%s" % (date, os, blackbord))
19 else:
20     print "not match str1"

 输出:

1 match_len:3
2 ('date(2017-11-28)', 'os:centos', 'blackbord[blog]')
3 date:2017-11-28
4 os:centos
5 blackbord:blog

 

例子中的正则表达式多次使用到了捕获组,主要是方便查找与输出。() 每个括号是一个捕获组。

更多关于捕获组的用法可以参考网上其他博客,

如: http://blog.csdn.net/lxcnn/article/details/4146148

 

相关文章
|
7月前
|
UED
销售易CRM:以用户体验为核心,驱动企业销售效能提升
销售易CRM是一款以用户体验为核心的企业客户关系管理工具。它通过简洁直观的操作界面降低学习成本,流畅稳定的系统性能提升办公效率,智能化功能助力精准识别高价值客户并优化销售流程,移动办公与离线支持打破时间和空间限制。全方位的高效、智能解决方案,助力企业在竞争中脱颖而出,实现持续发展。
|
12月前
|
自然语言处理 达摩院 数据挖掘
[大语言模型-论文精读] 阿里巴巴-通过多阶段对比学习实现通用文本嵌入
[大语言模型-论文精读] 阿里巴巴-通过多阶段对比学习实现通用文本嵌入
378 1
|
机器学习/深度学习 算法 数据可视化
技术心得记录:机器学习笔记之聚类算法层次聚类HierarchicalClustering
技术心得记录:机器学习笔记之聚类算法层次聚类HierarchicalClustering
210 0
|
SQL 分布式计算 Java
|
Web App开发 存储 运维
Java基层卫生健康云综合管理(云his)系统源码
Java基层卫生健康云综合管理(云his)系统源码
141 0
|
SQL 存储 资源调度
CDP中的Hive3系列之保护Hive3
作为管理员,您需要了解运行 Hive 查询的 Hive 默认授权是不安全的,以及您需要做什么来保护您的数据。您需要了解您的安全选项:设置 Ranger 或基于存储的授权 (SBA),它基于模拟和 HDFS 访问控制列表 (ACL),或这些方法的组合。 将 Apache Hive 访问限制为已批准的用户。Cloudera 推荐 Ranger。授权是检查用户权限以执行选择操作的过程,例如创建、读取和写入数据,以及编辑表元数据。Apache Ranger 为所有 Cloudera 运行时服务提供集中授权。 您可以设置 Ranger 以使用 Hadoop SQL 策略保护托管的 ACID 表或外部表。
1049 0
CDP中的Hive3系列之保护Hive3
|
数据可视化 Linux
【常用正则大全】
【常用正则大全】
332 0
【常用正则大全】
|
消息中间件 JavaScript 前端开发
js的EventLoop事件循环机制调用栈、微任务、消息队列执行顺序优先级
js的EventLoop事件循环机制调用栈、微任务、消息队列执行顺序优先级
86 0
|
移动开发 算法 Linux
mPaaS MGS配置SM2国密加密指南
因当前国家信息安全监管总局对金融类App监管要求,涉及到数据安全通信加密算法必须要使用国密的规定。众多使用mPaaS框架的银卡金融客户,因早期大多数都是在网关配置的RSA加密或者ECC加密算法,当接到监管要求后,都要更改网关加密算法为国密,因需求众多mPaaS团队也为此开发了网关同时兼容多个加密方式的功能,去解决客户侧因更换加密算法造成的种种不便和问题。 mPaaS 对国密算法加密客户端、网关都是支持的,这里整理一份从生成SM2到mPaaS配置完成的完整指南。
652 0
mPaaS MGS配置SM2国密加密指南