Python爬虫验证码识别——手机验证码的自动化处理

简介: Python爬虫验证码识别——手机验证码的自动化处理

手机验证码的自动化处理
有一种验证码就是手机验证码,如果在PC上出现了一个手机验证码,需要先在PC上输入手机号,然后把短信验证码发到手机上,再在PC上输入收到的验证码,才能通过验证。

遇到这样的情况,如何才能将识别流程自动化呢?

短信验证码的收发
通常,我们的自动化脚本运行在PC上,例如打开一个网页,然后模拟输入手机号,点击获取验证码,接下来就需要输入验证码了。前三个流程自动化很容易,但验证码发送到手机上了,怎么把它转给PC呢?

自动化验证码的整个收发流程,可以这么实现——当手机接收到一条短信时,自动将这条短信转发至某处,例如转发至一台远程服务器或者直接发给PC,在PC上我们可以通过一些方法获取短信内容并提取验证码,再自动化填充到输入的地方即可。
关键步骤是如下两步:

  1. 监听手机收到短信的事件
  2. 将短信内容转发至指定的位置

这两步缺一不可,而且都需要再手机上完成。思路其实简单,以Android手机为例,如果有Android开发经验,这两个功能实现起来很简单的。

  1. 首先如何监听手机接收到的短信呢?在Android开发中,分为三个必要环节。

  2. 注册读取短信的权限:在一个Android App中,读取短信需要具备特定的权限,所以需要在

    Android App的AndroidManifest.xml文件中将读取短信的权限配置好,例如:
    <uses-permission android:name="android.permission.RECEIVE_SMS"></uses-permission>
    

注册广播事件:Android有一个基本组件叫BroadcastReceiver,是广播接收者的意思,可以用它来监听来自系统的各种事件广播,例如系统电量不足的广播、系统来电的广播,那系统接收到短信的广播自然也不在话下。这类似于注册一个监听器来监听系统接收到短信的事件。这里我们在AndroidManifest.xml文件中注册一个BroadcastReceiver,叫做Sm```js
sReceiver:







**实现短信广播的接收:**这里就需要真正实现短信接收的逻辑了,只需要实现一个SmsReceiver类,它继承了BroadcastReceiver类,然后实现其onReceive方法即可,其中intent参数里就包含了我们想要的短信内容,实现如下:
```js
public class SmsReceiver extents BroadcastReceiver{
    @Override
    public void onReceive(Context context, Intent intent){
        Bundle bundle = intent.getExtras();
        SmsMessage msg = null;
        if (null !=bundle){
            Object[] smsObj = (Object[]) bundle.get("pdus");
                msg = SmsMessage.createFromPdu((bytep[]) object);
                Log.e("短信号码","" + msg.getOriginationAddress());
                Log.e("短信内容","" + msg.getDisplayMessageBody());
                Log.e("短信时间","" + msg.getTimestampMillis());
                }
            }
        }

如此一来,我们便实现了短信的接收。

收到短信之后,发送自然也很简单了,例如服务器提供一个API, 请求该API即可实现数据的发送,Android的一些HTTP请求库就可以实现这个逻辑,例如利用OkHttp构造一个HTTP请求。

有没有现成的解决方案呢?当然,完全可以借助一些开源实现。一个开源软件SmsForwarder,中文叫做短信转发器,其GitHub地址为https://github.com/pppscn/SmsForwarder。它的基本框架如图所示:

image.png

SmsForwarder的架构非常清晰,可以监听收到短信的事件,获取短信的来源号码、接收卡槽、短信内容、接收时间等,然后将这些内容通过一定的规则转发出去,支持转发到邮箱、企业微信群机器人、企业微信应用、Telegram机器人和Webhook等。

a.实战演示
使用Flask写一个API, 代码如下:

from flask import Flask, request, jsonify
from loguru import logger

app = Flask(__name__)

@app.route('/sms', methods=['POST'])
def receive():
    sms_content = request.form.get('content')
    logger.debug(f'received {sms_content}')
    return jsonify(status='success')

if __name__ == '__main__':
    app.run(debug=True)

设置一个路由,接收POST请求,然后读取了Request表单的内容,其中content就是短信内容的详情,之后将其打印出来。运行结果如下:

* Serving Flask app 'server'
 * Debug mode: on
WARNING: This is a development server. Do not use it in a production deployment. Use a production WSGI server instead.
 * Running on <http://127.0.0.1:5000>
Press CTRL+C to quit
 * Restarting with stat
 * Debugger is active!
 * Debugger PIN: 134-109-800

为了方便测试,可以用Ngrok工具将该服务器暴露到公网:

ngrok http 5000

运行之后,可以看到如下结果:

Session Status                online                                            
Account                       lxw1973 (Plan: Free)                              
Version                       3.8.0                                             
Region                        Japan (jp)                                        
Latency                       109ms                                             
Web Interface                 <http://127.0.0.1:4040>                             
Forwarding                    <https://ecb6-122-143-163-242.ngrok-free.app> -> htt

Connections                   ttl     opn     rt1     rt5     p50     p90       
                              0       0       0.00    0.00    0.00    0.00

可以看到Ngrok为我们配置了一个公网地址,例如访问https://ecb6-122-143-163-242.ngrok-free.app就相当于访问我们本地的http://localhost:5000服务,这样只需在手机上配置这个地址就可以将数据发送到PC端了。

接下来我们手机上打开SmsForder,添加一个Webhook类型的发送方,设置详情如图所示:

image.png

其中,我们把WebServer的URL直接设置成刚才Ngrok提供的公网地址,注意要在URL的后面加上sms。接着我们添加一个转发规则。如下图所示:
image.png

这里我们设置了内容匹配规则,将短信转发到Webhook这个发送方,即发送到我们刚刚搭建的Flask服务器上。添加完成后,可以尝试用另一台手机给当前运行次App的手机发送一个验证码信息,内容如下:

测试验证码65272752,一分钟有效

这时可以发现刚才的Flask服务器接收到了这样的结果,如图所示:
image.png

可以看到,发送给手机的验证码信息已经成功由手机发送到PC了,接着便可以对此信息进行解析和处理,然后存入数据库或消息队列。

a.批量收发
如果有大量手机和手机卡,则可以实现手机的群控处理,例如统一安装短信接收软件、统一配置相同的转发规则,从而接收和处理大量手机号的验证码。如图所示就是一个群控系统:

image.png

b.卡池、猫池
除了上面的方法,当然还有更专业的解决方案,例如用专业的手机卡池、猫池,配以专业的软件设备实现短信监听。如下图所示的设备支持插128张SIM卡,可以同时监听128个手机号的验证码。
image.png

c.接码平台
卡池、猫池的解决方案成本还是比较高的,而且这些方案其实已经不限于简单接收短信验证码了,就像手机群控系统一般会做手机群控爬虫,卡池也可以用来做4G/5G蜂窝代理,仅仅走短信收发当然也可以,未免有些浪费了。如果不想耗费过多成本,想实现短信验证码的自动化,还有一种方案就是接码平台,其基本思路如下:

  • 平台会维护大量手机号,并可能开放一些API或提供网页供我们调用来获取手机号和查看短信的内容。
  • 我们调用API或者爬取网页获取手机号,然后在对应的网站输入该手机号来获取验证码。
  • 通过调用API或者爬取网页获取对应手机号的短信内容,并交由爬虫处理。
相关文章
|
18天前
|
数据采集 存储 XML
Python爬虫定义入门知识
Python爬虫是用于自动化抓取互联网数据的程序。其基本概念包括爬虫、请求、响应和解析。常用库有Requests、BeautifulSoup、Scrapy和Selenium。工作流程包括发送请求、接收响应、解析数据和存储数据。注意事项包括遵守Robots协议、避免过度请求、处理异常和确保数据合法性。Python爬虫强大而灵活,但使用时需遵守法律法规。
|
19天前
|
数据采集 缓存 定位技术
网络延迟对Python爬虫速度的影响分析
网络延迟对Python爬虫速度的影响分析
|
20天前
|
数据采集 Web App开发 监控
高效爬取B站评论:Python爬虫的最佳实践
高效爬取B站评论:Python爬虫的最佳实践
|
12天前
|
开发者 Python
使用Python实现自动化邮件通知:当长时程序运行结束时
本文介绍了如何使用Python实现自动化邮件通知功能,当长时间运行的程序完成后自动发送邮件通知。主要内容包括:项目背景、设置SMTP服务、编写邮件发送函数、连接SMTP服务器、发送邮件及异常处理等步骤。通过这些步骤,可以有效提高工作效率,避免长时间等待程序结果。
51 9
|
11天前
|
运维 监控 网络安全
自动化运维的崛起:如何利用Python脚本简化日常任务
【10月更文挑战第43天】在数字化时代的浪潮中,运维工作已从繁琐的手工操作转变为高效的自动化流程。本文将引导您了解如何运用Python编写脚本,以实现日常运维任务的自动化,从而提升工作效率和准确性。我们将通过一个实际案例,展示如何使用Python来自动部署应用、监控服务器状态并生成报告。文章不仅适合运维新手入门,也能为有经验的运维工程师提供新的视角和灵感。
|
16天前
|
存储 Python
Python自动化脚本编写指南
【10月更文挑战第38天】本文旨在为初学者提供一条清晰的路径,通过Python实现日常任务的自动化。我们将从基础语法讲起,逐步引导读者理解如何将代码块组合成有效脚本,并探讨常见错误及调试技巧。文章不仅涉及理论知识,还包括实际案例分析,帮助读者快速入门并提升编程能力。
48 2
|
18天前
|
运维 监控 Python
自动化运维:使用Python脚本简化日常任务
【10月更文挑战第36天】在数字化时代,运维工作的效率和准确性成为企业竞争力的关键。本文将介绍如何通过编写Python脚本来自动化日常的运维任务,不仅提高工作效率,还能降低人为错误的风险。从基础的文件操作到进阶的网络管理,我们将一步步展示Python在自动化运维中的应用,并分享实用的代码示例,帮助读者快速掌握自动化运维的核心技能。
33 3
|
17天前
|
数据采集 IDE 测试技术
Python实现自动化办公:从基础到实践###
【10月更文挑战第21天】 本文将探讨如何利用Python编程语言实现自动化办公,从基础概念到实际操作,涵盖常用库、脚本编写技巧及实战案例。通过本文,读者将掌握使用Python提升工作效率的方法,减少重复性劳动,提高工作质量。 ###
34 1
|
21天前
|
数据采集 存储 JSON
Python爬虫开发中的分析与方案制定
Python爬虫开发中的分析与方案制定
|
12天前
|
数据采集 JavaScript 程序员
探索CSDN博客数据:使用Python爬虫技术
本文介绍了如何利用Python的requests和pyquery库爬取CSDN博客数据,包括环境准备、代码解析及注意事项,适合初学者学习。
49 0