前端工程师用Node.js + Appium实现APP自动化

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
简介: 网上全是python + Appium的教程,Appium也支持Node.js开发,使用Node.js + Appium实现了自动化爬虫功能。

简介

最近在使用Appium做爬虫功能,网上全是python + Appium的教程,Appium也支持Node.js开发,作为前端工程师使用Node.js + Appium实现了自动化爬虫功能

零零散散折腾了小两天的时间,踩了一些小坑,把流程和坑点整理出来供大家参考,希望让大家少踩坑、快速实现功能。

原理介绍

image.png

我们先搞清楚几个概念,看Appium是如何实现自动操作设备的,结合图片从右往左看:

  • Device是设备,有安卓、IOS、Windows、Mac等不同类型的设备。
  • Appium是一个Web服务器,与设备连接,可以通过接口来操作设备,实现自动化,本身也是Node应用。
  • Driver是驱动程序,不同的设备需要不同的驱动程序去控制,驱动程序属于Appium架构中的一部分。
  • Client即调用Appium接口的客户端,支持不同语言调用,比如Java、Node等语言调用。

总结:用Java、Node.js作为客户端调用 Appium服务端接口,Appium通过驱动控制设备,实现自动化操作。

环境搭建

不再一一介绍每个依赖的安装步骤,网上搭建环境的文章很多,主要是如下两点功能:

  1. 安装Java、Android的SDK,确保 adb命令可用,用于连接手机。
  2. 安装Node.js,用于运行Appium 和 webdriver.io(Client Node.js)。

adb命令使用

adb 简介,可以通过数据线或WIFI实现电脑与手机的连接,手机需要打开开发者调试选项,连接成功后,可以通过adb命令操作手机、安装、调试应用。

  • 查看设备列表:adb devices,如果成功连接手机,输入该命令后会展示设备列表。

image.png

  • 安装APK:adb install + apk路径

image.png

  • 查看当前打开的App包名与appActivity:

image.png
例如微信:com.tencent.mm 是包名,.ui.launcherUI 是 appActivity,这些参数在后边开发自动化功能时使用

Appium 服务启动

有两种方式启动服务,一种是安装命令行工具,通过命令行启动;第二种是安装 AppiumDesktop GUI软件启动,任选其一即可,作为前端工程师,首选命令行。

// 安装命令行
$ npm i --location=global appium

// 安装驱动
$ appium driver install uiautomator2

// 启动服务
$ appium

image.png

坑点1 不同手机的ADB设置

Appium启动后,会在手机上自动安装3个App,这里有个坑,不同的手机系统开发者选型设置不同,可能会有不同的问题,亲测我的VIVO和OPPO机型,Vivo必须允许三个App为高耗电后台运行,OPPO开发者选项中需要需要开启禁止权限监控,否则无法自动安装App,其他同事出现了App总是重复安装的问题。

小Tips:通过 Appium + 手机品牌 去搜索问题,更高效。
image.png
image.png

页面元素定位工具

appium inspector官方的GUI界面定位工具,可以通过参数启动App,并将App的画面和页面结构展示出来,以微信为例:填入我们获取到的appPackage 和 appActivity。
image.png

坑点2 启动参数务必增加 appium:noReset为true

这里有一个坑需要注意,必须设置appium:noReset参数为true,不然每次启动会清空你的App历史数据,我的微信数据被清理了 🙂。

image.png
点击Start Session按钮就可以看到页面的截图、结构和元素的信息了。
image.png

自动化开发

如果通过adb连接手机,并通过 appium inspector 成功获取到界面元素,那么恭喜你已经完成了80%的进展,剩下的就是通过Node.js + webdriver.io 开发自动化脚本,App自动跑起来了。

开发前这里我们要掌握webdriver.io的几个基本用法:

  1. 连接设备
  2. 通过页面元素选择器实现元素的单选、多选。
  3. 获取元素属性、点击元素。
  4. 滑动页面
  5. 保存图片

webdriver.io 的选择器和jquery的语法很类似,看一个Demo相信你就掌握了。

// 引入lib
const {
   
    remote } = require('webdriverio');


// 微信应用启动配置
const capabilities = {
   
   
  platformName: 'Android',
  'appium:automationName': 'UiAutomator2',
  'appium:deviceName': 'Android',
  'appium:appPackage': 'com.tencent.mm',  // 包名
  'appium:appActivity': '.ui.LauncherUI', // 启动页
  "appium:noReset": true, // 不复位数据
  "appium:unicodeKeyboard": false // 隐藏键盘
};


// Appium配置
const wdOpts = {
   
   
  hostname: process.env.APPIUM_HOST || 'localhost',
  port: parseInt(process.env.APPIUM_PORT, 10) || 4723,
  logLevel: 'info',
  capabilities,
};


// 入口
async function main() {
   
   

  // 设备实例
  const driver = await remote(wdOpts);

  try {
   
   

    // 通过Xpath获取元素
    // 单选  类名 + text
    const findBtn = await driver.$('//android.widget.TextView[@text="发现"]');
    // 单选  类名 + resource-id
    const myBtn = await driver.$('//android.widget.ImageView[@resource-id="com.tencent.mm:id/huj"]');
    // 多选 + 类名 + resource-id
    const commentList = await driver.$$('//android.widget.LinearLayout[@resource-id="com.tencent.mm:id/h1r"]');

    // 获取元素 text 属性
    const timeSel = await driver.$('//android.widget.ImageView[@resource-id="com.tencent.mm:id/huj"]');
    const time = await timeSel.getAttribute('text')

    // 点击元素
    await findBtn.click()


    // 向上滑动 开始坐标 + 滑动时间 + 结束坐标
    await driver.touchAction([
      {
   
   action: 'press', x: 379, y: 2098},
      {
   
   action: 'wait', ms: '2000'},
      {
   
   action: 'moveTo', x: 375, y: 606},
      'release'
    ]);

    // 暂停 1秒
    await driver.pause(1000);  

    // 保存图片
    const avatarSel = await item.$('//android.widget.ImageView[@resource-id="com.tencent.mm:id/a27"]');
    await avatarSel.saveScreenshot('./avatar.png');


  } finally {
   
   
    await driver.pause(1000);
    await driver.deleteSession();
  }
}

main().catch(console.error);

坑点3 滑动操作加时间

webdriver.io的文档中关于滑动操作,并没有提示必须加滑动时间,但实际开发中不加滑动时间,在App上会变成点击 + 滑动操作,经常会出现类似长按的操纵,所以务必加上wait的参数。

坑点4 键盘会被隐藏

unicodeKeyboard设置为false会将你的手机输入法关掉,重新启动输入法应用就可以了,还没研究清楚unicodeKeyboard参数的意义,大家实践后可以补充下。

效果展示

掌握选择器和操作语法后,前端工程师就能很快的实现自己的功能了,下边的截图是爬取我的微信视频号中的评论数据。
image.png

image.png
image.png

总结

我们再回顾下:

  • 环境:安卓JavA、Android的SDK,安装Node.js 和 Appium命令行。
  • 工具:adb连手机看参数、 Appium命令行启动服务、appium-inspector查看页面元素。
  • 流程:使用Node+ webdriverio,实现操作设备。
  • 语法:webdriverio 元素选择、模拟点击、滑动,获取元素属性 + 图片。

采坑:

  • 不同手机的开发者选项设置。
  • 启动参数务必加noReset。
  • 滑动事件务必加wait参数。
  • 键盘被隐藏,重新打开输入法即可。

最后,爬虫有风险,大家不要做违法违规的事,我是前端工程师秦少卫,不到之处恳请斧正,欢迎大家点赞关注评论,我们一起成长。

相关链接:

相关实践学习
阿里云百炼xAnalyticDB PostgreSQL构建AIGC应用
通过该实验体验在阿里云百炼中构建企业专属知识库构建及应用全流程。同时体验使用ADB-PG向量检索引擎提供专属安全存储,保障企业数据隐私安全。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
28天前
|
JavaScript 前端开发 程序员
前端原生Js批量修改页面元素属性的2个方法
原生 Js 的 getElementsByClassName 和 querySelectorAll 都能获取批量的页面元素,但是它们之间有些细微的差别,稍不注意,就很容易弄错!
|
2月前
|
JavaScript 前端开发 程序员
前端学习笔记——node.js
前端学习笔记——node.js
48 0
|
25天前
|
JavaScript 前端开发 Java
springboot解决js前端跨域问题,javascript跨域问题解决
本文介绍了如何在Spring Boot项目中编写Filter过滤器以处理跨域问题,并通过一个示例展示了使用JavaScript进行跨域请求的方法。首先,在Spring Boot应用中添加一个实现了`Filter`接口的类,设置响应头允许所有来源的跨域请求。接着,通过一个简单的HTML页面和jQuery发送AJAX请求到指定URL,验证跨域请求是否成功。文中还提供了请求成功的响应数据样例及请求效果截图。
springboot解决js前端跨域问题,javascript跨域问题解决
|
1月前
|
Java 测试技术 持续交付
【入门思路】基于Python+Unittest+Appium+Excel+BeautifulReport的App/移动端UI自动化测试框架搭建思路
本文重点讲解如何搭建App自动化测试框架的思路,而非完整源码。主要内容包括实现目的、框架设计、环境依赖和框架的主要组成部分。适用于初学者,旨在帮助其快速掌握App自动化测试的基本技能。文中详细介绍了从需求分析到技术栈选择,再到具体模块的封装与实现,包括登录、截图、日志、测试报告和邮件服务等。同时提供了运行效果的展示,便于理解和实践。
95 4
【入门思路】基于Python+Unittest+Appium+Excel+BeautifulReport的App/移动端UI自动化测试框架搭建思路
|
29天前
|
JSON 前端开发 JavaScript
聊聊 Go 语言中的 JSON 序列化与 js 前端交互类型失真问题
在Web开发中,后端与前端的数据交换常使用JSON格式,但JavaScript的数字类型仅能安全处理-2^53到2^53间的整数,超出此范围会导致精度丢失。本文通过Go语言的`encoding/json`包,介绍如何通过将大整数以字符串形式序列化和反序列化,有效解决这一问题,确保前后端数据交换的准确性。
35 4
|
1月前
|
机器学习/深度学习 自然语言处理 前端开发
前端神经网络入门:Brain.js - 详细介绍和对比不同的实现 - CNN、RNN、DNN、FFNN -无需准备环境打开浏览器即可测试运行-支持WebGPU加速
本文介绍了如何使用 JavaScript 神经网络库 **Brain.js** 实现不同类型的神经网络,包括前馈神经网络(FFNN)、深度神经网络(DNN)和循环神经网络(RNN)。通过简单的示例和代码,帮助前端开发者快速入门并理解神经网络的基本概念。文章还对比了各类神经网络的特点和适用场景,并简要介绍了卷积神经网络(CNN)的替代方案。
111 1
|
1月前
|
移动开发 前端开发 JavaScript
前端实训,刚入门,我用原生技术(H5、C3、JS、JQ)手写【网易游戏】页面特效
于辰在大学期间带领团队参考网易游戏官网的部分游戏页面,开发了一系列前端实训作品。项目包括首页、2021校园招聘页面和明日之后游戏页面,涉及多种特效实现,如动态图片切换和人物聚合效果。作品源码已上传至CSDN,视频效果可在CSDN预览。
40 0
前端实训,刚入门,我用原生技术(H5、C3、JS、JQ)手写【网易游戏】页面特效
|
1月前
|
JavaScript 前端开发 开发者
前端框架对比:Vue.js与Angular的优劣分析与选择建议
【10月更文挑战第27天】在前端开发领域,Vue.js和Angular是两个备受瞩目的框架。本文对比了两者的优劣,Vue.js以轻量级和易上手著称,适合快速开发小型到中型项目;Angular则由Google支持,功能全面,适合大型企业级应用。选择时需考虑项目需求、团队熟悉度和长期维护等因素。
47 1
|
1月前
|
JavaScript 前端开发 API
前端框架对比:Vue.js与Angular的优劣分析与选择建议
【10月更文挑战第26天】前端技术的飞速发展让开发者在构建用户界面时有了更多选择。本文对比了Vue.js和Angular两大框架,介绍了它们的特点和优劣,并给出了在实际项目中如何选择的建议。Vue.js轻量级、易上手,适合小型项目;Angular结构化、功能强大,适合大型项目。
35 1
|
1月前
|
前端开发 JavaScript UED
"前端小技巧大揭秘:JS如何将后台时间戳秒变亲切小时前、分钟前,让用户秒懂,提升互动体验!"
【10月更文挑战第23天】在Web开发中,将后台返回的时间戳转换为“小时前”、“分钟前”、“刚刚”等友好的时间描述是常见需求。本文介绍如何用JavaScript实现这一功能,通过计算当前时间和时间戳的差值,返回相应的描述,提升用户体验。
32 1