这里是清安,本章一起来了解一下ifame标签,iframe多用于嵌套页面。最常见的就是登录窗口了。例如QQ空间,知乎的登录界面,都有用到。本章主要以QQ空间为例,一起来看看:
❝进入Url:https://i.qq.com/。
方法一:按下F12,鼠标点击登录框,审查元素,就能看到iframe框了。
方法二:按下F12,CTRL+F,在搜索框中输入iframe,也能搜索到。
❞
简单的小脚本
好了, 此处看了iframe标签了。我们如何来定位呢。上述图片中有id,有name属性,所以我们正常进行定位切换就好了。
from selenium import webdriver fox = webdriver.Firefox() fox.get("https://i.qq.com/") # 定位标签 ifranme = fox.find_element_by_id('login_frame') # 切换到标签上 fox.switch_to.frame(ifranme) fox.find_element_by_id('switcher_plogin').click() fox.find_element_by_id('u').send_keys('清安无别事') fox.find_element_by_id('p').send_keys('欢迎入坑') fox.quit()
此处是一个小例子,我们使用switch_to.frame()可以切入到标签内部,然后进行各种操作。实际上可能会遇见没有任何属性的iframe,所以这时候就要考虑到标签定位了。这里回到了元素定位基础了,就不作多的阐述了。
往后还可能遇到一个HTML中存在多个iframe标签的情况,善于结合Python,Selenium基础来书写代码。原理都是一样的。
封装iframe讲解
那么切入进去之后如何切出呢,或者还有其他的办法切入吗。答案是有的。看封装好的一个小例子。这里就不解释如何封装的了,可以直接看看Python系列,有讲。
# -->>>清安<<<--- from selenium import webdriver from selenium.webdriver.common.by import By from time import sleep from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.support.wait import WebDriverWait class Test(object): def __init__(self): self.fox = webdriver.Firefox() self.fox.get('https://i.qq.com/') def get_element(self, ele, local): return self.fox.find_element(ele, local) def click_(self, ele, local): self.get_element(ele, local).click() def get_text(self, *local): sleep(1) txt = self.get_element(*local) print(txt.text) def frame_(self, ele, local): """ :return: 切入frame """ sleep(1) self.fox.switch_to.frame(self.get_element(ele, local)) def parent_frame(self): """ :return: 切出frame """ sleep(1) # self.fox.switch_to.default_content() self.fox.switch_to.parent_frame() def wait_(self): """ :return: 显示等待头部 """ return WebDriverWait(self.fox, 10, 0.5) def wait_frame(self, ele, local): """ :return: 显示等待+iframe标签的使用 """ self.wait_().until(EC.frame_to_be_available_and_switch_to_it(self.get_element(ele, local)), message='iframe不可跳转') if __name__ == '__main__': t = Test() # 实例化类,直接打开url t.frame_(By.ID, 'login_frame') # 定位iframe标签 t.get_text(By.ID, 'switcher_plogin') # 获取文本信息 t.click_(By.ID, 'switcher_plogin') # 点击操作 t.get_text(By.ID, 'login_button') # 获取文本信息 t.parent_frame() # 切出iframe t.get_text(By.XPATH, "//*[text()='空间活动']") # 获取文本信息 t.wait_frame(By.ID, 'login_frame') # 用iframe显示等待 t.get_text(By.XPATH, '//*[text()="新用户注册"]') # 获取文本信息
此处举例了如何切出iframe,也就是parent_frame方法,里面介绍了两种方法。
self.fox.switch_to.parent_frame()是切换到父级,如果没有父级的iframe,那么保持默认,也就是说将焦点切出原iframe标签。
self.fox.switch_to.default_content()会直接将焦点切出iframe标签。
切出后我们就可以做其他的操作了。上述代码中,我们定位了“空间活动”,并打印了它的文本值。
上述代码中我们还用到了一个显示等待,也是有关iframe标签的,这也是一种切换方式。一起来看看源码:
class frame_to_be_available_and_switch_to_it(object): """ An expectation for checking whether the given frame is available to switch to. If the frame is available it switches the given driver to the specified frame. """ def __init__(self, locator): self.frame_locator = locator def __call__(self, driver): try: if isinstance(self.frame_locator, tuple): driver.switch_to.frame(_find_element(driver, self.frame_locator)) else: driver.switch_to.frame(self.frame_locator) return True except NoSuchFrameException: return False
看源码中,简单点理解:如果self.frame_locator是元组,则进行切换,否则,还是切换,并返回True。都不对,则告诉你错误,返回False。所以啊,用了这个显示等待也就不需要另外写iframe标签切换了。也能不加强制等待、担心时间不够元素没渲染出来,导致脚本报错了。
总结
❝1、上述的封装中,并未用到较多的显示等待,而是简单的使用了强制等待,这是不值得提倡的。
2、封装的套路可以模仿,自己写一写。
3、大家记得写好注释
4、上述代码中,切换iframe还有很大的优化空间,可以自己试试如何优化