selenium-元素定位+下拉选选项实战

简介: selenium-元素定位+下拉选选项实战

元素定位有不同的写法,而元素组定位仅仅只是增加了一个索引取值的方式的进行定位,后续会有介绍到具体的用法,这里介绍时用到的例子不一,主要是告诉各位用法是怎么样的。

具体的实例,最后将会有一个小实战。会给出项目地址。各位可自行进行编写。写完可以发给博主看看,博主微信qing_an_an。

关于项目,如果你发现登录不上了,跑不通了,可以私聊我,也可以自己先看看是不是元素属性变动了导致的,可以自己改改。

元素定位

name方法

我们打开浏览器搜索https://baidu.com,我们以百度为例。

这里很明显有id,有class,有name定位方法给到你,我们这里先讲述name元素定位方法

from selenium import webdriver
import time
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element_by_name('wd').send_keys('北海有渔啊')
time.sleep(2)
fox.quit()

这里我在定位方式后面加上了.send_keys()方法,因为这是输入框,需要输入内容的,所以就加上了,也是为了效果明显有些。自己跑一边看看效果就能秒懂!

id方法

上面我们用百度的例子定位了输入框,那么我们这回来定位搜索按钮并点击它。

from selenium import webdriver
import time
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element_by_name('wd').send_keys('北海有渔啊')
fox.find_element_by_id('su').click()
time.sleep(2)
fox.quit()

这样我们就能开启代码百度搜索内容了。是不是很神奇。自己动手 尝试吧。

class_name方法

本例还是采用百度进行举例,百度是可以帮我们学习到很多的东西的哦!!

from selenium import webdriver
import time
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element_by_class_name('s_ipt').send_keys('北海有渔啊')
fox.find_element_by_id('su').click()
time.sleep(2)
fox.quit()

xpath方法

xpath方法定位起来相对便捷一些,粘贴复制,当然这是最普通的xpath,这里介绍两种xpath方法!

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element_by_xpath('//*[@id="kw"]').send_keys('北海有渔啊')
fox.find_element_by_id('su').click()

第二种也许你会看不懂,看图你就懂了!这种方法我觉的还是比较简便的,xpath万能的定位方式!!!

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element_by_xpath('//*[@id="kw"]').send_keys('北海有渔啊')
fox.find_element_by_xpath('//*[@value="百度一下"]').click()

这里我们定位的是value值等于百度一下,你复制xpath你会发现复制下来的是'//*[@id="su"]')这样的写法。所以这里会稍加不同,也可以在不同的场景中使用,比如:很多ID为su的时候,value值不同,你可以不用find_by_elements的方法进行定位,直接使用手写的xpath方法进行定位。xpath定位不止这两种,在后续的过程中会一一具体展示。

tag_name方法

此方法用于定位标签名,单独配合find_element例子让我一顿好找。

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://www.taobao.com/')
fox.find_element_by_tag_name('input').send_keys('奥运')
fox.quit()

标签名定位的方式方法用的比较的少,一般性常用的就是id,name,xpath。

link_text方法

此方法可以用于文字定位,唯一不好的一点就是需要定位的是一段完整的名字,否则无法定位到。我个人不是很喜欢这个定位方法。

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://xueshu.baidu.com/')
fox.find_element_by_link_text('这里有你想知道的关于文献互助的一切').click()
fox.quit()

此方法太繁琐了,为了找寻例题,封存了多少张图,勉强放出这一张出来...

partial_link_text方法

这个方法先对上个方法那就是简洁的太多了,便捷!!!此方法不需要全部的文本信息就可以定位,但是这些都会有一定的弊端,就是汉字很多的时候难免会出现重复的。

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element_by_partial_link_text('hao').click()
fox.quit()

css_selector方法

css定位方法,跟xpath类似。

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element_by_css_selector('#kw').send_keys('北海有渔啊')
fox.quit()

By方法

看个人喜欢哪一种。这个方法需要导入一个类,其他的定位方式与find_element系列完全一致,就是准确的元素定位一块写法有一些别致,此例子也是百度输入框的例子,我也就不附图了。君若喜欢可以By.XPATH,By.NAME等,后面的例题中举出了不需要倒包,不用By的类似方法。

from selenium import webdriver
from selenium.webdriver.common.by import By
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_element(By.ID,'kw').send_keys('北海有渔啊')

元素组

class_name方法

之所以讲这个是因为没有找到合适的例子来说,我会尽量多少几个讲解一下,明白一个其他的都是类似的写法。举一反三!!!

这里有很多的a标签,里面有很多的class,这些class在一个div里面,这里我们就可以看作一个列表,你定位到了class后,根据索引进行取值,从而达到定位的效果,索引取值从0开始,所以这里取0时定位的是新闻,取1时定位的时hao123

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://baidu.com')
fox.find_elements_by_class_name('mnav.c-font-normal')[0].click()
fox.quit()

这里还是有几点要说的:

1、元素组取值有空格时你可以只取前面的几个值,这里就是mnav,再通过索引也是可以定位到的。

2、遇到空格,你碍于强迫症非要加上后面的,那就跟我一样的写法,加上.就好了,将前后连接起来。

3、这里也可以用我上一章所说的,用文本值进行定位,所以说萝卜青菜各有所爱。

xpath方法

这里我用的是一个学习网址的一个例子,找了半天网上大部分都是class类的元素组,太苦了我!!!

from selenium import webdriver
fox = webdriver.Firefox()
fox.get('https://www.w3school.com.cn/python/python_inheritance.asp')
fox.find_elements_by_xpath('/html/body/div/div[3]/div[1]/ul[1]/li[1]/a')[0].click()

其他的用法大同小异,这里介绍这两种,准确的说看第一种是完全可以看懂用法。

下拉列表定位

下拉列表常见的前端表现形式:Select+Option 和 ul+li,这种方法可以用,到后面讲到鼠标键盘操作的时候,有一些下拉列表定位可以直接用鼠标来实现了。

如这个例子,12306购票网站的。看图,我想选中时间,这是一个select标签,我们需要导入一个类才能定位到,并且select给了三种定位方法(实际不止三种,这里我们用的上的只有两种)

from selenium import webdriver
from selenium.webdriver.support.ui import Select
fox = webdriver.Firefox()
fox.get('https://kyfw.12306.cn/otn/leftTicket/init?linktypeid=dc')
fox.find_element_by_id('qd_closeDefaultWarningWindowDialog_id').click()
# 先定位select元素
ele = fox.find_element_by_id('cc_start_time')
# 配合方法进行定位值
# Select(ele).select_by_value('00000600')
Select(ele).select_by_index(1)

可以取value值,可以用索引取值。都是可以直接修改这个时间的。如果你想获取元素的文本值,怎么办用?元素.text,然后用变量接收,print出来就好了。不论是下拉框的文本值还是其他的文本值,基本上都可以用这个方法。

项目实战

元素定位中除了文中介绍的方法,更有一些其他的方法。一起看看。会在文中指出来。

       项目地址:http://39.98.138.157/shopxo/public/index.php?s=/index/user/logininfo.html

import time
from selenium import webdriver
fox = webdriver.Firefox()
fox.get('http://39.98.138.157/shopxo/public/index.php?s=/index/user/logininfo.html')
# 等待两秒渲染界面
time.sleep(2)
# 点击注册
"""此处元素定位方式写法有一定的不同"""
# 定位输入框
fox.find_element('name','accounts').send_keys('qinganan')
fox.find_element('name','pwd').send_keys('1234567')
# 点击登录
fox.find_element('class name','am-btn.am-btn-primary').click()
fox.quit()

这里是一个简单的登录项目实战,(注意,楼上的元素定位稍有点不一样,这可以算是另一种不同的写法)。

关于验证码!如果有验证码的情况下。如果你不会,那就设置强制等待久一点自己手动输入。在工作中可以要求开发屏蔽掉的或者写一个万能的验证码。因为自动化中有一准则抛弃实现难度大的。虽然此项技术不算难度大,要想准确识别,需要企业花一定资金购买其他平台的接口。最直接的操作就是开发屏蔽掉,然后人为对此项进行校验。

目录
相关文章
|
Web App开发 数据采集 C#
解决Firefox代理身份验证弹出窗口问题:C#和Selenium实战指南
本文是一份实战指南,主要介绍了在使用Selenium和C#进行网页抓取时,如何设置代理服务器的身份验证以避免自动化流程中断。文章首先列出了所需的开发环境和工具,然后通过C#代码示例详细展示了如何在Firefox浏览器中设置代理IP、端口、用户名、密码以及UserAgent和Cookies。代码中包含了自动处理代理身份验证弹出窗口的配置,以及如何添加Cookies的方法。最后,文章强调了结合C#和Selenium可以提高网页抓取任务的稳定性和效率。
409 3
解决Firefox代理身份验证弹出窗口问题:C#和Selenium实战指南
|
Web App开发 XML 前端开发
Selenium安装及八大元素定位方法&介绍及使用教程
Selenium是一个支持多种编程语言的自动化测试工具,用于Web应用的测试。它提供了多种元素定位策略,包括ID、Name、Class Name、Tag Name、Link Text、Partial Link Text、CSS Selector和XPath。安装Selenium需先确保Python和pip已安装,然后通过pip安装库,并下载对应浏览器的WebDriver。验证安装成功后,可通过编写简单脚本来打开网页并打印标题。注意WebDriver版本应与浏览器兼容,且可能需要额外的依赖包。文章还介绍了XPath的两种类型及其区别,推荐使用相对XPath以提高稳定性。
751 0
|
数据采集 测试技术 Python
自动化淘宝秒杀:使用Selenium WebDriver的实战指南
本文详细介绍了如何利用Selenium WebDriver自动化淘宝秒杀操作,包括环境配置、代码实现及注意事项,旨在帮助读者提升秒杀成功率,同时提醒合理使用以遵守平台规则。
991 132
|
8月前
|
数据采集 Web App开发 机器学习/深度学习
Selenium爬虫部署七大常见错误及修复方案:从踩坑到避坑的实战指南
本文揭秘Selenium爬虫常见“翻车”原因,涵盖浏览器闪退、元素定位失败、版本冲突、验证码识别等七大高频问题,结合实战案例与解决方案,助你打造稳定高效的自动化爬虫系统,实现从“能用”到“好用”的跨越。
1091 0
|
数据采集 Web App开发 前端开发
Python爬虫进阶:Selenium在动态网页抓取中的实战
【10月更文挑战第26天】动态网页抓取是网络爬虫的难点,因为数据通常通过JavaScript异步加载。Selenium通过模拟浏览器行为,可以加载和执行JavaScript,从而获取动态网页的完整内容。本文通过实战案例,介绍如何使用Selenium在Python中抓取动态网页。首先安装Selenium库和浏览器驱动,然后通过示例代码展示如何抓取英国国家美术馆的图片信息。
1009 6
|
设计模式 Java 测试技术
【Selenium使用误区】Iframe元素定位失败:避免误提GitHub Issue的技巧
本文分享了作者在使用Selenium进行UI自动化测试时遇到的一个常见问题:在模拟登录163邮箱的过程中,元素定位失败,原因是没有正确地定位到iframe内的元素。文章通过分析问题原因、提供解决方案和附录代码,指导读者如何避免类似的错误,并强调了在UI自动化测试中准确定位页面元素的重要性。
429 1
|
XML 前端开发 JavaScript
[selenium]元素定位
[selenium]元素定位
316 1
|
数据采集 数据安全/隐私保护 Python
Selenium与Web Scraping:自动化获取电影名称和评分的实战指南
在信息时代,Web Scraping 成为核心技能之一,尤其在面对如豆瓣电影这类动态网页时更为重要。本文介绍如何运用 Selenium 这一强大的自动化工具,配合代理 IP、User-Agent 及 Cookie,实现对豆瓣电影名称与评分的有效抓取。通过设置代理 IP 来规避访问限制,调整 User-Agent 以模拟真实用户行为,并利用 Cookie 保持会话状态,确保数据抓取的稳定性和隐蔽性。文中还提供了完整的 Python 代码示例,帮助读者快速上手实践。
553 0
|
JavaScript 前端开发 Java
《手把手教你》系列技巧篇(四十九)-java+ selenium自动化测试-隐藏元素定位与操作(详解教程)
【5月更文挑战第13天】本文主要讨论了在Selenium自动化测试中如何处理前端隐藏元素的问题。隐藏元素通常是通过`type="hidden"`或`style="display: none;"`属性实现的,它们在页面上不可见,但仍然存在于HTML代码中。Selenium可以定位到这些隐藏元素,但无法直接进行点击、输入等操作,会报错“ElementNotInteractableException”。
524 3
|
Web App开发 前端开发 JavaScript
《手把手教你》系列技巧篇(二十)-java+ selenium自动化测试-元素定位大法之终卷(详细教程)
【4月更文挑战第12天】本文介绍了Selenium的八种元素定位方式,包括id、name、class name、css selector、link text、partial link text、tag name和xpath,并给出了每种方式的示例代码。建议在选择定位方法时,优先使用唯一性的id和name,其次考虑css或xpath,但要注意它们的性能影响。
625 6