开发者社区> 科技小先锋> 正文

从文件中提取email地址

简介:
+关注继续查看

在网上看了一篇文章是关于提示email的,看了以后觉得作者的正则表达式有些问题,所以自己就修改了一下,源码如下:


  1. package com.sucre.api.test;   
  2. /**   
  3.  * 提取邮件地址  
  4.  * @author 乔磊   
  5.  * @version create time:2011-1-7 上午10:55:05   
  6.  *   
  7.  */ 
  8.  
  9. import java.io.File;  
  10. import java.io.IOException;  
  11. import java.util.regex.Matcher;  
  12. import java.util.regex.Pattern;  
  13. import org.apache.commons.io.FileUtils;  
  14.  
  15. public class EmailParser {  
  16.       
  17.     private final static Pattern emailer = Pattern.compile("\\w+([-+.]\\w+)*@\\w+([-.]\\w+)*\\.\\w+([-.]\\w+)*");  
  18.     public static void main(String[] args) throws IOException {  
  19.         String txt = FileUtils.readFileToString(new File(args[0]));  
  20.         Matcher matchr = emailer.matcher(txt);  
  21.         while (matchr.find()) {  
  22.             String email = matchr.group();  
  23.             System.out.println(email);  
  24.         }  
  25.     }  
  26.  

作者先前的正则表达式是这样的


  1. private final static Pattern emailer = Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");  

这样在提取的时候会把aa@.com这样形式的email也提取出来的,所以是不正确的。



本文转自sucre03 51CTO博客,原文链接:http://blog.51cto.com/sucre/473736,如需转载请自行联系原作者

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
maven 打包时去除依赖包 或者文件
maven打包时会把该包依赖的包一起打进来,但某些时候我们并不需要这些包,例如xerces(用于解析XML)导进来后可能会造成tomcat启动的异常(包冲突),需要打包时排除掉。 1、排除依赖包           <dependency>             <groupId>commons-dbcp</groupId&g
2458 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
24840 0
暴力枚举Gmail邮箱地址的新姿势
本文讲的是暴力枚举Gmail邮箱地址的新姿势,本文将介绍一种比较经典的枚举用户Gmail邮箱地址的新思路,这种思路可以检索成千上万个Gmail邮箱地址。
2249 0
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
19817 0
多源文件内核模块Makefile模板
作者:gfree.wind@gmail.com 博客:blog.focus-linux.net   linuxfocus.blog.chinaunix.net  微博:weibo.com/glinuxer QQ技术群:4367710 编译内核模块时,一个源文件的Makefile模板到处都是: obj-m := module.
627 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
18072 0
6967
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
OceanBase 入门到实战教程
立即下载
阿里云图数据库GDB,加速开启“图智”未来.ppt
立即下载
实时数仓Hologres技术实战一本通2.0版(下)
立即下载