文档备案控制台

开发者社区大数据文章正文

数据清洗中的正则

2022-11-11 188

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 数据清洗中经常使用的正则表达式

sql类型 CHECK_NULL ${field} is null 检查空值
sql类型身份证号码检查 !regexp_like(${field},'^[1-9][0-9]{5}(18|19|20)[0-9]{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)[0-9]{3}[0-9Xx]$') and !regexp_like(${field},'^[1-9][0-9]{5}[0-9]{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)[1-9]{3}$')
sql类型电话号码检测 !regexp_like(${field},'^1[3|4|5|7|8][0-9]\d{8}$')
sql类型港澳通行证 !regexp_like(${field},'^[HMhm]{1}([0-9]{10}|[0-9]{8})$')
sql类型台湾通行证 !regexp_like(${field},'^([0-9]{8}|[0-9]{10})$')
sql类型银行卡号 !regexp_like(${field},'^([1-9]{1})([0-9]{14}|[0-9]{18})$')
sql类型电子邮件 !regexp_like(${field},'^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(.[a-zA-Z0-9_-]+)+$')
sql类型 QQ号码 !regexp_like(${field},'1-9{4,}')
sql类型车牌号 !regexp_like(${field},'^[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领A-Z]{1}[A-Z]{1}[A-Z0-9]{4}[A-Z0-9挂学警港澳]{1}$')
sql类型护照 !regexp_like(${field},'^[a-zA-Z0-9]{5,17}$')

文章标签：

数据采集

SQL

清欢君

目录

相关文章

Lvzt

|

Python

pip安装第三方库报错WARNING: Retrying (Retry(total=4，connect=None， read=Noneredirect=None，status=None))解决

pip安装第三方库报错WARNING: Retrying (Retry(total=4，connect=None， read=Noneredirect=None，status=None))解决

Lvzt

4004 0 0

pip安装第三方库报错WARNING: Retrying (Retry(total=4，connect=None， read=Noneredirect=None，status=None))解决

程序媛三妹ya

Conda 修改连接镜像

Conda 修改连接镜像

程序媛三妹ya

4821 0 0

LucianaiB

|

17天前

|

人工智能数据可视化安全

王炸组合！阿里云 OpenClaw X 飞书 CLI，开启 Agent 基建狂潮！(附带免费使用6个月服务器)

本文详解如何用阿里云Lighthouse一键部署OpenClaw，结合飞书CLI等工具，让AI真正“动手”——自动群发、生成科研日报、整理知识库。核心理念：未来软件应为AI而生，CLI即AI的“手脚”，实现高效、安全、可控的智能自动化。

LucianaiB

34817 45 143

王炸组合！阿里云 OpenClaw X 飞书 CLI，开启 Agent 基建狂潮！(附带免费使用6个月服务器)

兮动人

|

11天前

|

人工智能自然语言处理安全

Claude Code 全攻略：命令大全 + 实战工作流（建议收藏）

本文介绍了Claude Code终端AI助手的使用指南，主要内容包括：1)常用命令如版本查看、项目启动和更新；2)三种工作模式切换及界面说明；3)核心功能指令速查表，包含初始化、压缩对话、清除历史等操作；4)详细解析了/init、/help、/clear、/compact、/memory等关键命令的使用场景和语法。文章通过丰富的界面截图和场景示例，帮助开发者快速掌握如何通过命令行和交互界面高效使用Claude Code进行项目开发，特别强调了CLAUDE.md文件作为项目知识库的核心作用。

兮动人

10807 36 168

Claude Code 全攻略：命令大全 + 实战工作流（建议收藏）

林浩学AI

|

6天前

|

人工智能 JavaScript Ubuntu

低成本搭建AIP自动化写作系统：Hermes保姆级使用教程，长文和逐步实操贴图

我带着怀疑的态度，深度使用了几天，聚焦微信公众号AIP自动化写作场景，写出来的几篇文章，几乎没有什么修改，至少合乎我本人的意愿，而且排版风格，也越来越完善，同样是起码过得了我自己这一关。这个其实OpenClaw早可以实现了，但是目前我觉得最大的区别是，Hermes会自主总结提炼，并更新你的写作技能。相信就冲这一点，就值得一试。这篇帖子主要就Hermes部署使用，作一个非常详细的介绍，几乎一步一贴图。关于Hermes，无论你赞成哪种声音，我希望都是你自己动手行动过，发自内心的选择！

林浩学AI

2264 22 39

LucianaiB

|

29天前

|

人工智能 JSON 机器人

让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw

本文带你零成本玩转OpenClaw：学生认证白嫖6个月阿里云服务器，手把手配置飞书机器人、接入免费/高性价比AI模型（NVIDIA/通义），并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿，5分钟完成热点→文章全流程！

LucianaiB

45716 156 571

让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw

热门文章

最新文章

教你用Python发现即将流失的客户（附代码、安装教程、学习资源）

什么是缓存击穿？

tensorflow：流程，概念和简单代码注释

阿里云CDN加速和全站加速DCDN区别及如何选择？

iGraph 2015双促复盘总结

阿里云学生服务器购买价格及学生免费服务器配置领取条件

SpringCloud Alibaba - Nacos 作为配置中心 & 读取Properties配置信息

各大在线地图，使用的经纬度坐标为什么都精确到小数点之后第六位？

加载exe的PE信息并输出相关PE信息的一段c++代码

RhinoMock入门（7）——Do，With和Record-playback

Hermes Agent纯免费部署教程：适合新手尝鲜，阿里云提供ECS免费部署Hermes Agent

新手也能搭！阿里云轻量服务器一键部署 Hermes Agent，开源自进化 AI 智能体

Hermes Agent 部署教程：阿里云轻量服务器新手0基础搭建自进化AI智能体，太简单了

超详细！Hermes Agent 一键部署全流程指南，轻松上手不踩坑

普通摄像头秒变“透视仪”：黎曼分形透镜如何让微弱瑕疵无处遁形（军工项目之外研究）

SpringBoot对接黄金白银期货数据API

Maven 本地仓库替代私仓配置指南

【SpringSecurity新手村系列】（4）验证码功能实现

【SpringSecurity新手村系列】（3）自定义登录页与表单认证

当旅行规划开始理解礼仪边界，Agent协同与DМ‌XΑ‌РΙ才有用武之地

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

开通oss服务