数据清洗中的正则

简介: 数据清洗中经常使用的正则表达式

sql类型 CHECK_NULL ${field} is null 检查空值
sql类型 身份证号码检查 !regexp_like(${field},'^[1-9][0-9]{5}(18|19|20)[0-9]{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)[0-9]{3}[0-9Xx]$') and !regexp_like(${field},'^[1-9][0-9]{5}[0-9]{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)[1-9]{3}$')
sql类型 电话号码检测 !regexp_like(${field},'^1[3|4|5|7|8][0-9]\d{8}$')
sql类型 港澳通行证 !regexp_like(${field},'^[HMhm]{1}([0-9]{10}|[0-9]{8})$')
sql类型 台湾通行证 !regexp_like(${field},'^([0-9]{8}|[0-9]{10})$')
sql类型 银行卡号 !regexp_like(${field},'^([1-9]{1})([0-9]{14}|[0-9]{18})$')
sql类型 电子邮件 !regexp_like(${field},'^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(.[a-zA-Z0-9_-]+)+$')
sql类型 QQ号码 !regexp_like(${field},'1-9{4,}')
sql类型 车牌号 !regexp_like(${field},'^[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领A-Z]{1}[A-Z]{1}[A-Z0-9]{4}[A-Z0-9挂学警港澳]{1}$')
sql类型 护照 !regexp_like(${field},'^[a-zA-Z0-9]{5,17}$')

目录
相关文章
|
编解码 自然语言处理 算法
生成对抗网络的应用有哪些
【10月更文挑战第14天】生成对抗网络的应用有哪些
|
机器学习/深度学习 编解码 物联网
Adobe新研究0.11秒从草图生成图像
Adobe Research和卡内基梅隆大学的研究团队开发了一项新技术,能在0.11秒内将创意草图转化为高质图像,突破了传统图像合成技术的速度和数据需求限制。采用单步图像翻译方法,结合对抗性学习,适应性调整网络以快速适应新控制信号。实验显示, CycleGAN-Turbo和pix2pix-Turbo模型在图像转换任务中表现优越,但仍有控制强度、负提示和高分辨率合成的局限。
270 2
Adobe新研究0.11秒从草图生成图像
|
存储 机器学习/深度学习 缓存
【C++】deque的实现原理简单介绍
【C++】deque的实现原理简单介绍
|
Python
pip安装第三方库报错WARNING: Retrying (Retry(total=4,connect=None, read=Noneredirect=None,status=None))解决
pip安装第三方库报错WARNING: Retrying (Retry(total=4,connect=None, read=Noneredirect=None,status=None))解决
3348 0
pip安装第三方库报错WARNING: Retrying (Retry(total=4,connect=None, read=Noneredirect=None,status=None))解决
|
4天前
|
云安全 人工智能 安全
AI被攻击怎么办?
阿里云提供 AI 全栈安全能力,其中对网络攻击的主动识别、智能阻断与快速响应构成其核心防线,依托原生安全防护为客户筑牢免疫屏障。
|
14天前
|
域名解析 人工智能
【实操攻略】手把手教学,免费领取.CN域名
即日起至2025年12月31日,购买万小智AI建站或云·企业官网,每单可免费领1个.CN域名首年!跟我了解领取攻略吧~
|
8天前
|
安全 Java Android开发
深度解析 Android 崩溃捕获原理及从崩溃到归因的闭环实践
崩溃堆栈全是 a.b.c?Native 错误查不到行号?本文详解 Android 崩溃采集全链路原理,教你如何把“天书”变“说明书”。RUM SDK 已支持一键接入。
548 206
下一篇
oss云网关配置