【selenium实例一】网易云歌单封面图片

简介: 简介:【selenium实例一】网易云歌单封面图片

一、前言


本文仅用于交流学习,不得用于商业行为

如果单纯的使用requests库,是不能获取到完整的源代码的;

如果想进行分析的话,刷新获取数据,则会出现这样的界面:image.png因此,选择使用selenium是非常好的一个选择!


二、selenium获取数据


以歌单广场的一页为例,获取到歌单的封面image.png这里使用两个方法:

  1. 使用selenium获取到网页源代码,然后使用pyquery库进行解析,从而获取数据
  2. 直接使用selenium获取数据,利用selenium的页面元素定位

1、第一种方法

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from pyquery import PyQuery as pq
import time
start = time.time()
# 配置
option = Options()
# 为Chrome配置无头模式
option.add_argument("--headless")
# 启动浏览器时加入配置
driver = webdriver.Chrome(options=option)
# 访问网页
driver.get('https://music.163.com/#/discover/playlist/?order=hot&cat=%E5%85%A8%E9%83%A8&limit=35&offset=35')
# 切换到iframe表单
driver.switch_to.frame('g_iframe')
# 获取源代码
html = driver.execute_script('return document.documentElement.outerHTML')
# 利用pyquery库进行解析
doc = pq(html)
# 定位到所有含有封面图片链接的节点
links = doc('#m-pl-container li div img')
# 打印封面图片链接数量
print(f"该页面含有{len(links)}张图片")
# 进行遍历
for link in links.items():
    # 获取封面图片链接
    src = link.attr('src')
    # 打印链接
    print(src)
# 关闭所有页面
driver.quit()
print("总共用时:{}".format(time.time()-start))
  • 输出结果:
    图片链接过多,仅展示部分结果
该页面含有35张图片
http://p2.music.126.net/DHRO3u68N0HbSF_Is08S6A==/109951166538173595.jpg?param=140y140
http://p2.music.126.net/FkcsntKQ2JgvJZktcJ0uPw==/109951166647447993.jpg?param=140y140
http://p2.music.126.net/9ROYGXi0iJyY97bgbdEDSg==/109951166741042192.jpg?param=140y140
总共用时:5.121241807937622

2、第二种方法

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
import time
start = time.time()
# 配置
option = Options()
# 为Chrome配置无头模式
option.add_argument("--headless")
# 启动浏览器时加入配置
driver = webdriver.Chrome(options=option)
# 访问网页
driver.get('https://music.163.com/#/discover/playlist/?order=hot&cat=%E5%85%A8%E9%83%A8&limit=35&offset=35')
# 切换到iframe表单
driver.switch_to.frame('g_iframe')
# 定位到所有含有封面图片链接的节点
links = driver.find_elements(By.CSS_SELECTOR, '#m-pl-container .j-flag')
# 打印封面图片链接数量
print(f"该页面含有{len(links)}张图片")
# 进行遍历
for element in links:
    # 打印封面图片链接
    print(element.get_attribute('src'))
# 关闭所有页面
driver.quit()
print("总共用时:{}".format(time.time()-start))
  • 输出结果:
    图片链接过多,仅展示部分结果
该页面含有35张图片
http://p2.music.126.net/DHRO3u68N0HbSF_Is08S6A==/109951166538173595.jpg?param=140y140
http://p2.music.126.net/FkcsntKQ2JgvJZktcJ0uPw==/109951166647447993.jpg?param=140y140
http://p2.music.126.net/9ROYGXi0iJyY97bgbdEDSg==/109951166741042192.jpg?param=140y140
http://p2.music.126.net/fkZa3CIMPpwv45MwjaGtVQ==/109951166623085189.jpg?param=140y140
总共用时:5.274672031402588

3、总结

这两种方法进行比较,就速度而言,第一种方法略快。

且第一种方法更适合喜欢通过页面源代码进行获取数据的小伙伴。

相关文章
|
Web App开发
Python+selenium 实现自动上传并发布微信视频号短视频实例演示
Python+selenium 实现自动上传并发布微信视频号短视频实例演示
1103 0
Python+selenium 实现自动上传并发布微信视频号短视频实例演示
|
Web App开发
Python+selenium 实现自动上传并发布小红书号短视频实例演示
Python+selenium 实现自动上传并发布小红书号短视频实例演示
1046 0
Python+selenium 实现自动上传并发布小红书号短视频实例演示
|
数据采集 Web App开发 存储
Java爬虫第五篇:使用selenium、Jsoup 抓取bing搜索图片
Java爬虫第五篇:使用selenium、Jsoup 抓取bing搜索图片
310 0
|
数据采集 Web App开发 存储
Java爬虫第四篇:使用selenium、Jsoup 抓取图片
Java爬虫第四篇:使用selenium、Jsoup 抓取图片
566 0
|
Web App开发
Python+selenium 实现趣头条的短视频自动上传与发布实例演示(支持抖音、快手、b站、小红书等平台)
Python+selenium 实现趣头条的短视频自动上传与发布实例演示(支持抖音、快手、b站、小红书等平台)
404 0
|
Docker Python Windows
Docker selenium 自动化 - 使用python操作docker,python运行、启用、停用和查询容器实例演示
Docker selenium 自动化 - 使用python操作docker,python运行、启用、停用和查询容器实例演示
1156 0
Docker selenium 自动化 - 使用python操作docker,python运行、启用、停用和查询容器实例演示
|
Web App开发
Python+Selenium 自动化-指定chrome驱动运行selenium实例演示,运行指定位置下的浏览器驱动
Python+Selenium 自动化-指定chrome驱动运行selenium实例演示,运行指定位置下的浏览器驱动
526 0
Python+Selenium 自动化-指定chrome驱动运行selenium实例演示,运行指定位置下的浏览器驱动
|
Web App开发
Python+selenium 自媒体自动化 - 实现自动投稿、自动发布哔哩哔哩B站短视频实例演示
Python+selenium 自媒体自动化 - 实现自动投稿、自动发布哔哩哔哩B站短视频实例演示
931 0
Python+selenium 自媒体自动化 - 实现自动投稿、自动发布哔哩哔哩B站短视频实例演示
|
Web App开发
Python+selenium 实现自动上传并发布西瓜视频实例演示
Python+selenium 实现自动上传并发布西瓜视频实例演示
418 1
Python+selenium 实现自动上传并发布西瓜视频实例演示
|
Web App开发
Python+selenium 实现自动上传并发布抖音短视频实例演示
Python+selenium 实现自动上传并发布抖音短视频实例演示
2075 1
Python+selenium 实现自动上传并发布抖音短视频实例演示

热门文章

最新文章

下一篇
DataWorks