备案控制台

开发者社区大数据文章正文

网络爬虫之抓取邮箱

2018-06-18 3011

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： import java.util.regex.Matcher;import java.util.regex.Pattern;/* 抓取邮箱号码 */public class Demo7 { public static void ma...

import java.util.regex.Matcher;
import java.util.regex.Pattern;

/*
 抓取邮箱号码
 */
public class Demo7 {
    public static void main(String[] args) {
        String str = "有事没事联系：1122423@qq.com 有事没事联系：1122423@qq.com 有事没事联系：1122423@qq.com "
                + "有事没事联系：1122423@qq.com 有事没事联系：1122423@qq.com 有事没事联系：1122423@qq.com"
                + "有事没事联系：1122423@qq.com 有事没事联系：1122423@qq.com.cn 有事没事联：1122423@qq.com.cn"
                + "有事没事联系：1122423@163.com 有事没事联系：1122423@qq.net";
        String reg = "[a-zA-Z1-9]\\w{1,11}@[a-zA-Z0-9]{2,}(\\.[a-z]{2,3}){1,2}";
        /*
         第一步：
            先要把字符串的正则编译成Pattern对象
        */
        Pattern p = Pattern.compile(reg);
        /*
         第二步：
            把正则对象匹配字符串对象得到一个匹配器
         */
        Matcher m = p.matcher(str);
        while(m.find()){
            System.out.println(m.group());
        }
    }
}

文章标签：

数据采集

关键词：

爬虫抓取

网络抓取

网络邮箱

lambdaλ

目录

相关文章

小白学大数据

|

4月前

|

数据采集存储前端开发

动态渲染爬虫：Selenium抓取京东关键字搜索结果

动态渲染爬虫：Selenium抓取京东关键字搜索结果

小白学大数据

326 0 0

小白学大数据

|

4月前

|

数据采集存储前端开发

Java爬虫性能优化：多线程抓取JSP动态数据实践

Java爬虫性能优化：多线程抓取JSP动态数据实践

小白学大数据

174 0 0

小白学大数据

|

4月前

|

数据采集存储 JSON

地区电影市场分析：用Python爬虫抓取猫眼/灯塔专业版各地区票房

地区电影市场分析：用Python爬虫抓取猫眼/灯塔专业版各地区票房

小白学大数据

388 2 2

小白学大数据

|

7月前

|

数据采集 Web App开发 JavaScript

基于Selenium的Python爬虫抓取动态App图片

基于Selenium的Python爬虫抓取动态App图片

小白学大数据

526 68 69

小白学大数据

|

4月前

|

数据采集存储 XML

Python爬虫XPath实战：电商商品ID的精准抓取策略

Python爬虫XPath实战：电商商品ID的精准抓取策略

小白学大数据

463 0 0

蓝易云

|

7月前

|

数据采集

Haskell编程中，利用HTTP爬虫实现IP抓取

以上就是利用Haskell编写IP抓取爬虫的详细步骤。希望这篇文章的演示对于理解在Haskell这种函数式编程语言中如何实现网络爬虫有所帮助，而其中的网络访问、标签解析和列表处理等技术在许多其他的问题中都有广泛的应用。

蓝易云

176 26 26

小白学大数据

|

7月前

|

数据采集存储前端开发

Python爬虫自动化：批量抓取网页中的A链接

Python爬虫自动化：批量抓取网页中的A链接

小白学大数据

328 4 5

dasein58

|

7月前

|

数据采集缓存监控

如何提高爬虫的抓取效率

提高爬虫的抓取效率是爬虫开发中的一个重要目标。以下是一些可以提高爬虫抓取效率的方法和技巧： 1. 合理设置请求频率避免过高频率：频繁的请求可能会对目标服务器造成过大压力，甚至导致被封禁。合理设置请求间隔时间，例如每次请求间隔几秒到几十秒。动态调整频率：根据目标网站的响应时间动态调整请求频率。如果响应时间较长，适当降低请求频率；如果响应时间较短，可以适当提高请求频率。

dasein58

256 6 6

站大爷

|

8月前

|

数据采集存储缓存

Python爬虫与代理IP：高效抓取数据的实战指南

在数据驱动的时代，网络爬虫是获取信息的重要工具。本文详解如何用Python结合代理IP抓取数据：从基础概念（爬虫原理与代理作用）到环境搭建（核心库与代理选择），再到实战步骤（单线程、多线程及Scrapy框架应用）。同时探讨反爬策略、数据处理与存储，并强调伦理与法律边界。最后分享性能优化技巧，助您高效抓取公开数据，实现技术与伦理的平衡。

站大爷

416 4 5

小白学大数据

|

8月前

|

数据采集存储 NoSQL

如何避免Python爬虫重复抓取相同页面？

如何避免Python爬虫重复抓取相同页面？

小白学大数据

347 1 2

热门文章

最新文章

实战：Python爬虫如何模拟登录与维持会话状态

Prompt 工程实战：如何让 AI 生成高质量的 aiohttp 异步爬虫代码

win10系统以太网未识别网络没有有效ip配置怎么办？

解决Ubuntu系统的网络连接问题

配置VM网络：如何设定静态IP以访问主机IP和互联网

概率神经网络的分类预测--基于PNN的变压器故障诊断（Matlab代码实现）

基于python大数据的青少年网络使用情况分析及预测系统

王耀恒：从网络营销老兵到GEO技术布道者

Python 网络请求架构——统一 SOCKS5 接入与配置管理

阿里云渠道商：怎么配置阿里云网络ACL？

基于SpringBoot+Vue+uniapp的网络直播带货查询系统的详细设计和实现(源码+lw+部署文档+讲解等)

基于SpringBoot+Vue+uniapp的数据结构课程网络学习平台的详细设计和实现(源码+lw+部署文档+讲解等)

mac docker 宿主机和容器间网络打通

网络防御前线：揭秘加密技术与提升网络安全意识

网络安全与信息安全：防护之道与加密技术的深度解析

网络安全与信息安全：防护、策略与实践

网络安全与信息安全：防护之道在技术与意识并行

基于SpringBoot+Vue+uniapp的网络书店系统的详细设计和实现(源码+lw+部署文档+讲解等)

构建安全防线：在云计算时代维护网络与信息安全深入理解PHP的命名空间与自动加载机制

构建未来：AI驱动的自适应网络安全防御系统

相关课程

更多

云网络白皮书-阿里云网络系列课

企业上云攻略-阿里云网络产品应用系列教程

Python爬虫实战

Linux网络进阶 - TCP/IP协议及OSI七层模型

Python网络爬虫实战

网络管理者必知-2分钟了解新出台的《网络安全法》

相关电子书

更多

Deep Dive：应用交付网络架构设计

Deep Dive：跨地域网络架构设计

Python第五讲——关于爬虫如何做js逆向的思路

下一篇

「直播预告」Streaming Lakehouse Meetup EP.2｜Paimon × StarRocks 共话实时湖仓