selenium-元素定位+下拉框代码实战

简介: selenium-元素定位+下拉框代码实战

元素定位有不同的写法,而元素组定位仅仅只是增加了一个索引取值的方式的进行定位,后续会有介绍到具体的用法,这里介绍时用到的例子不一,主要是告诉各位用法是怎么样的。

具体的实例,最后将会有一个小实战。会给出项目地址。各位可自行进行编写。写完可以发给博主看看,博主微信qing_an_an。水军一枚。欢迎骚扰。

元素定位

name方法


我们打开浏览器搜索https://baidu.com,我们以百度为例。

这里很明显有id,有class,有name定位方法给到你,我们这里先讲述name元素定位方法

from selenium import webdriver
import time
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element_by_name('wd').send_keys('北海有渔啊')
time.sleep(2)
fox.quit()

这里我在定位方式后面加上了.send_keys()方法,因为这是输入框,需要输入内容的,所以就加上了,也是为了效果明显有些。自己跑一边看看效果就能秒懂!

id方法

上面我们用百度的例子定位了输入框,那么我们这回来定位搜索按钮并点击它。


from selenium import webdriver
import time
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element_by_name('wd').send_keys('北海有渔啊')
fox.find_element_by_id('su').click()
time.sleep(2)
fox.quit()

这样我们就能开启代码百度搜索内容了。是不是很神奇。自己动手 尝试吧。

class_name方法

本例还是采用百度进行举例,百度是可以帮我们学习到很多的东西的哦!!

from selenium import webdriver
import time
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element_by_class_name('s_ipt').send_keys('北海有渔啊')
fox.find_element_by_id('su').click()
time.sleep(2)
fox.quit()

xpath方法

xpath方法定位起来相对便捷一些,粘贴复制,当然这是最普通的xpath,这里介绍两种xpath方法!

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element_by_xpath('//*[@id="kw"]').send_keys('北海有渔啊')
fox.find_element_by_id('su').click()

第二种也许你会看不懂,看图你就懂了!这种方法我觉的还是比较简便的,xpath万能的定位方式!!!

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element_by_xpath('//*[@id="kw"]').send_keys('北海有渔啊')
fox.find_element_by_xpath('//*[@value="百度一下"]').click()

这里我们定位的是value值等于百度一下,你复制xpath你会发现复制下来的是'//*[@id="su"]')这样的写法。所以这里会稍加不同,也可以在不同的场景中使用,比如:很多ID为su的时候,value值不同,你可以不用find_by_elements的方法进行定位,直接使用手写的xpath方法进行定位。xpath定位不止这两种,在后续的过程中会一一具体展示。

tag_name方法

此方法用于定位标签名,单独配合find_element例子让我一顿好找。

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://www.taobao.com/')
fox.find_element_by_tag_name('input').send_keys('奥运')
fox.quit()

标签名定位的方式方法用的比较的少,一般性常用的就是id,name,xpath。

link_text方法

此方法可以用于文字定位,唯一不好的一点就是需要定位的是一段完整的名字,否则无法定位到。我个人不是很喜欢这个定位方法。

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://xueshu.baidu.com/')
fox.find_element_by_link_text('这里有你想知道的关于文献互助的一切').click()
fox.quit()

此方法太繁琐了,为了找寻例题,封存了多少张图,勉强放出这一张出来...

partial_link_text方法

这个方法先对上个方法那就是简洁的太多了,便捷!!!此方法不需要全部的文本信息就可以定位,但是这些都会有一定的弊端,就是汉字很多的时候难免会出现重复的。

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element_by_partial_link_text('hao').click()
fox.quit()

css_selector方法

css定位方法,跟xpath类似。

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element_by_css_selector('#kw').send_keys('北海有渔啊')
fox.quit()

By方法

看个人喜欢哪一种。这个方法需要导入一个类,其他的定位方式与find_element系列完全一致,就是准确的元素定位一块写法有一些别致,此例子也是百度输入框的例子,我也就不附图了。君若喜欢可以By.XPATH,By.NAME等,后面的例题中举出了不需要倒包,不用By的类似方法。

from selenium import webdriver
from selenium.webdriver.common.by import By
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element(By.ID,'kw').send_keys('北海有渔啊')

元素组

class_name方法

之所以讲这个是因为没有找到合适的例子来说,我会尽量多少几个讲解一下,明白一个其他的都是类似的写法。举一反三!!!

这里有很多的a标签,里面有很多的class,这些class在一个div里面,这里我们就可以看作一个列表,你定位到了class后,根据索引进行取值,从而达到定位的效果,索引取值从0开始,所以这里取0时定位的是新闻,取1时定位的时hao123

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_elements_by_class_name('mnav.c-font-normal')[0].click()
fox.quit()

这里还是有几点要说的:

1、元素组取值有空格时你可以只取前面的几个值,这里就是mnav,再通过索引也是可以定位到的。

2、遇到空格,你碍于强迫症非要加上后面的,那就跟我一样的写法,加上.就好了,将前后连接起来。

3、这里也可以用我上一章所说的,用文本值进行定位,所以说萝卜青菜各有所爱。

xpath方法

这里我用的是一个学习网址的一个例子,找了半天网上大部分都是class类的元素组,太苦了我!!!

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://www.w3school.com.cn/python/python_inheritance.asp')
fox.find_elements_by_xpath('/html/body/div/div[3]/div[1]/ul[1]/li[1]/a')[0].click()

其他的用法大同小异,这里介绍这两种,准确的说看第一种是完全可以看懂用法。

下拉列表定位

下拉列表常见的前端表现形式:Select+Option 和 ul+li,这种方法可以用,到后面讲到鼠标键盘操作的时候,有一些下拉列表定位可以直接用鼠标来实现了。

如这个例子,12306购票网站的。看图,我想选中时间,这是一个select标签,我们需要导入一个类才能定位到,并且select给了三种定位方法(实际不止三种,这里我们用的上的只有两种)

from selenium import webdriver
from selenium.webdriver.support.ui import Select
fox = webdriver.Firefox()
fox.get('https://kyfw.12306.cn/otn/leftTicket/init?linktypeid=dc')
fox.find_element_by_id('qd_closeDefaultWarningWindowDialog_id').click()
# 先定位select元素
ele = fox.find_element_by_id('cc_start_time')
# 配合方法进行定位值
# Select(ele).select_by_value('00000600')
Select(ele).select_by_index(1)

可以取value值,可以用索引取值。都是可以直接修改这个时间的。

项目实战

元素定位中除了文中介绍的方法,更有一些其他的方法。一起看看。会在文中指出来。

       项目地址:http://8.129.162.225:8080/

import time
from selenium import webdriver
fox = webdriver.Firefox()
fox.get('http://8.129.162.225:8080/')
# 等待两秒渲染界面
time.sleep(2)
# 点击注册
"""此处元素定位方式写法有一定的不同"""
fox.find_element('class name','am-btn-primary.btn.am-fr').click()
time.sleep(2)
# 定位输入框
fox.find_element('name','accounts').send_keys('qinganan')
fox.find_element('name','pwd').send_keys('1234567')
time.sleep(10)
# 这里需要自己手动输入验证码
# 勾选同意按钮
fox.find_element('class name','am-icon-checked').click()
# 点击注册
fox.find_element('xpath','/html/body/div[4]/div/div/div/div[2]/div[1]/div/div[1]/form/div[5]/button').click()
fox.close()
fox.quit()

这里是一个简单的注册项目实战,不过过程中验证码一处需要自己手动输入,自动输入也是可以的,不过存在误差很容易识别错误。并且需要借助其他平台的接口才可以。所以这里直接手动输入的实在。

不过可以放心的是,企业中会让开发屏蔽掉的。因为自动化中有一准则抛弃实现难度大的。虽然此项技术不算难度大,要想准确识别,需要企业花一定资金购买其他平台的接口。最直接的操作就是开发屏蔽掉,然后人为对此项进行校验。

目录
相关文章
|
Web App开发 数据采集 C#
解决Firefox代理身份验证弹出窗口问题:C#和Selenium实战指南
本文是一份实战指南,主要介绍了在使用Selenium和C#进行网页抓取时,如何设置代理服务器的身份验证以避免自动化流程中断。文章首先列出了所需的开发环境和工具,然后通过C#代码示例详细展示了如何在Firefox浏览器中设置代理IP、端口、用户名、密码以及UserAgent和Cookies。代码中包含了自动处理代理身份验证弹出窗口的配置,以及如何添加Cookies的方法。最后,文章强调了结合C#和Selenium可以提高网页抓取任务的稳定性和效率。
286 3
解决Firefox代理身份验证弹出窗口问题:C#和Selenium实战指南
|
Web App开发 XML 前端开发
Selenium安装及八大元素定位方法&介绍及使用教程
Selenium是一个支持多种编程语言的自动化测试工具,用于Web应用的测试。它提供了多种元素定位策略,包括ID、Name、Class Name、Tag Name、Link Text、Partial Link Text、CSS Selector和XPath。安装Selenium需先确保Python和pip已安装,然后通过pip安装库,并下载对应浏览器的WebDriver。验证安装成功后,可通过编写简单脚本来打开网页并打印标题。注意WebDriver版本应与浏览器兼容,且可能需要额外的依赖包。文章还介绍了XPath的两种类型及其区别,推荐使用相对XPath以提高稳定性。
560 0
|
2月前
|
数据采集 Web App开发 机器学习/深度学习
Selenium爬虫部署七大常见错误及修复方案:从踩坑到避坑的实战指南
本文揭秘Selenium爬虫常见“翻车”原因,涵盖浏览器闪退、元素定位失败、版本冲突、验证码识别等七大高频问题,结合实战案例与解决方案,助你打造稳定高效的自动化爬虫系统,实现从“能用”到“好用”的跨越。
527 0
|
12月前
|
数据采集 测试技术 Python
自动化淘宝秒杀:使用Selenium WebDriver的实战指南
本文详细介绍了如何利用Selenium WebDriver自动化淘宝秒杀操作,包括环境配置、代码实现及注意事项,旨在帮助读者提升秒杀成功率,同时提醒合理使用以遵守平台规则。
554 8
|
数据采集 Web App开发 前端开发
Python爬虫进阶:Selenium在动态网页抓取中的实战
【10月更文挑战第26天】动态网页抓取是网络爬虫的难点,因为数据通常通过JavaScript异步加载。Selenium通过模拟浏览器行为,可以加载和执行JavaScript,从而获取动态网页的完整内容。本文通过实战案例,介绍如何使用Selenium在Python中抓取动态网页。首先安装Selenium库和浏览器驱动,然后通过示例代码展示如何抓取英国国家美术馆的图片信息。
702 6
|
设计模式 Java 测试技术
【Selenium使用误区】Iframe元素定位失败:避免误提GitHub Issue的技巧
本文分享了作者在使用Selenium进行UI自动化测试时遇到的一个常见问题:在模拟登录163邮箱的过程中,元素定位失败,原因是没有正确地定位到iframe内的元素。文章通过分析问题原因、提供解决方案和附录代码,指导读者如何避免类似的错误,并强调了在UI自动化测试中准确定位页面元素的重要性。
277 1
|
XML 前端开发 JavaScript
[selenium]元素定位
[selenium]元素定位
185 1
|
数据采集 数据安全/隐私保护 Python
Selenium与Web Scraping:自动化获取电影名称和评分的实战指南
在信息时代,Web Scraping 成为核心技能之一,尤其在面对如豆瓣电影这类动态网页时更为重要。本文介绍如何运用 Selenium 这一强大的自动化工具,配合代理 IP、User-Agent 及 Cookie,实现对豆瓣电影名称与评分的有效抓取。通过设置代理 IP 来规避访问限制,调整 User-Agent 以模拟真实用户行为,并利用 Cookie 保持会话状态,确保数据抓取的稳定性和隐蔽性。文中还提供了完整的 Python 代码示例,帮助读者快速上手实践。
443 0
|
Java 测试技术 Web App开发
《手把手教你》系列技巧篇(六十二)-java+ selenium自动化测试-RemoteWebDriver让你的代码与测试分离(远程测试)
【6月更文挑战第3天】本文介绍了在没有本地浏览器的情况下,如何使用RemoteWebDriver进行远程自动化测试。RemoteWebDriver分为客户端和服务端,客户端运行测试代码,服务端启动服务。服务端需要安装JDK、浏览器和对应的WebDriver,并启动selenium-server-standalone.jar。客户端通过URL连接到服务端,并指定预期的浏览器类型。这样,客户端的测试代码就能远程控制服务端的浏览器执行自动化测试。RemoteWebDriver的优点包括跨平台和浏览器测试、提高测试稳定性以及使测试环境和执行代码的机器分离。
877 3
|
JavaScript 前端开发 Java
《手把手教你》系列技巧篇(四十九)-java+ selenium自动化测试-隐藏元素定位与操作(详解教程)
【5月更文挑战第13天】本文主要讨论了在Selenium自动化测试中如何处理前端隐藏元素的问题。隐藏元素通常是通过`type="hidden"`或`style="display: none;"`属性实现的,它们在页面上不可见,但仍然存在于HTML代码中。Selenium可以定位到这些隐藏元素,但无法直接进行点击、输入等操作,会报错“ElementNotInteractableException”。
371 3