备案控制台

开发者社区开发与运维文章正文

【Python】数据解析—Xpath解析

2023-11-03 97

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

公共DNS（含HTTPDNS解析），每月1000万次HTTP解析

云解析 DNS，旗舰版 1个月

全局流量管理 GTM，标准版 1个月

简介： 【Python】数据解析—Xpath解析

1.安装lxml

命令：pip install lxml

image.png

2. 语法

from lxml import etree
tree = etree.parse(filepath)

/xxx/text():取xxx节点里头的文本

/xxx//yyytext():取xxx后代中所有的yyy节点里头的文本

/xxx/*/yyy/text():取xxx节点用任意节点包裹的yyy节点里头的文本

/xxx/*/yyy[n]/text():取xxx节点用任意节点包裹的第n个索引的yyy节点里头的文本

/xxx/*/yyy[@attr_name="attr_value"]/text():取xxx节点用任意节点包裹的属性名为attr_name，属性值为attr_value的yyy节点里头的文本

./:相对位置

.../xxx/@attr_name:取属性attr_name的值

3. 一个Google小工具技巧

偷懒小技巧.png

4. Demo 猪八戒网站爬取商品信息

from lxml import etree
import requests
url = 'https://wuhan.zbj.com/search/service/?kw=saas'
content = requests.get(url)
content.encoding = 'utf-8'
html = etree.HTML(content.text)
oDivs1 = html.xpath('//*[@id="__layout"]/div/div[3]/div/div[4]/div/div[2]/div[1]/div')
for div in oDivs1:
    price = div.xpath('./div[1]/div[3]/div[1]/span/text()')[0].strip('¥')
    title = div.xpath('./div/div[3]/div[2]/a/text()')[0]
    rate = div.xpath('./div/div[3]/div[4]/div[1]/span[1]/span/text()')[0]
    print(price,title,rate)

文章标签：

云解析DNS

Python

索引

关键词：

云解析DNS python

Python数据

Python解析

python云解析DNS

Python xpath解析

YiYa_咿呀

目录

相关文章

爱专研的技术土狗

|

5天前

|

数据采集 JSON API

深入解析：使用 Python 爬虫获取淘宝店铺所有商品接口

本文介绍如何使用Python结合淘宝开放平台API获取指定店铺所有商品数据。首先需注册淘宝开放平台账号、创建应用并获取API密钥，申请接口权限。接着，通过构建请求、生成签名、调用接口（如`taobao.items.search`和`taobao.item.get`）及处理响应，实现数据抓取。代码示例展示了分页处理和错误处理方法，并强调了调用频率限制、数据安全等注意事项。此技能对开发者和数据分析师极具价值。

爱专研的技术土狗

90 2 2

奔跑的数据

|

5天前

|

数据采集 JSON 数据可视化

JSON数据解析实战：从嵌套结构到结构化表格

在信息爆炸的时代，从杂乱数据中提取精准知识图谱是数据侦探的挑战。本文以Google Scholar为例，解析嵌套JSON数据，提取文献信息并转换为结构化表格，通过Graphviz制作技术关系图谱，揭示文献间的隐秘联系。代码涵盖代理IP、请求头设置、JSON解析及可视化，提供完整实战案例。

奔跑的数据

41 4 4

JSON数据解析实战：从嵌套结构到结构化表格

技术交流18179014480

|

6天前

|

机器学习/深度学习 JSON 算法

淘宝拍立淘按图搜索API接口系列的应用与数据解析

淘宝拍立淘按图搜索API接口是阿里巴巴旗下淘宝平台提供的一项基于图像识别技术的创新服务。以下是对该接口系列的应用与数据解析的详细分析

技术交流18179014480

28 4 5

小芸cloud

|

21天前

|

存储人工智能程序员

通义灵码AI程序员实战：从零构建Python记账本应用的开发全解析

本文通过开发Python记账本应用的真实案例，展示通义灵码AI程序员2.0的代码生成能力。从需求分析到功能实现、界面升级及测试覆盖，AI程序员展现了需求转化、技术选型、测试驱动和代码可维护性等核心价值。文中详细解析了如何使用Python标准库和tkinter库实现命令行及图形化界面，并生成单元测试用例，确保应用的稳定性和可维护性。尽管AI工具显著提升开发效率，但用户仍需具备编程基础以进行调试和优化。

小芸cloud

210 9 10

蓝易云

|

19天前

|

Java API 数据处理

深潜数据海洋：Java文件读写全面解析与实战指南

通过本文的详细解析与实战示例，您可以系统地掌握Java中各种文件读写操作，从基本的读写到高效的NIO操作，再到文件复制、移动和删除。希望这些内容能够帮助您在实际项目中处理文件数据，提高开发效率和代码质量。

蓝易云

24 4 4

WBKJ_Noah18870292986

|

5天前

|

存储缓存监控

如何高效爬取天猫商品数据？官方API与非官方接口全解析

本文介绍两种天猫商品数据爬取方案：官方API和非官方接口。官方API合法合规，适合企业长期使用，需申请企业资质；非官方接口适合快速验证需求，但需应对反爬机制。详细内容涵盖开发步骤、Python实现示例、反爬策略、数据解析与存储、注意事项及扩展应用场景。推荐工具链包括Playwright、aiohttp、lxml等。如需进一步帮助，请联系作者。

WBKJ_Noah18870292986

30 0 0

技术交流18179014480

|

6天前

|

JSON API 数据格式

淘宝商品评论API接口系列的应用与数据解析

在电商平台中，用户评论是了解商品质量、服务水平和用户满意度的重要数据来源。淘宝作为中国最大的电商平台，提供了商品评论API接口，帮助开发者获取和分析用户评价数据。本文将介绍淘宝商品评论API接口系列的作用、使用方法，并通过示例展示如何调用API并解析返回的JSON数据。

技术交流18179014480

30 0 0

小白学大数据

|

13天前

|

存储数据采集 JSON

Python爬取某云热歌榜：解析动态加载的歌曲数据

Python爬取某云热歌榜：解析动态加载的歌曲数据

小白学大数据

24 0 0

游客4egshivbqn3ei

|

9月前

|

XML JavaScript 关系型数据库

Python XML 解析

Python XML 解析

游客4egshivbqn3ei

55 4 4

张志凌

|

XML JavaScript 关系型数据库

Python基础之 Python3 XML 解析 5

Python3 XML 解析

张志凌

98 1 1

热门文章

最新文章

DeepSeek模型的突破：性能超越R1满血版的关键技术解析

企业级API集成方案：基于阿里云函数计算调用DeepSeek全解析

2025年阿里云弹性裸金属服务器架构解析与资源配置方案

阿里云轻量应用服务器产品解析与搭建个人博客网站教程参考

免费通配符SSL证书不限制申请-2025最新渠道解析

深入解析图神经网络注意力机制：数学原理与可视化实现

BioMedGPT-R1：生物医药ChatGPT诞生！蒸馏DeepSeek R1突破人类专家水平，分子解析+靶点预测一键搞定

深度解析：使用ChromeDriver和webdriver_manager实现无头浏览器爬虫

Evo 2：基因编程AI革命！！DNA版GPT-4问世：100万碱基全解析，自动设计基因编辑器

生成式 AI 大语言模型（LLMs）核心算法及源码解析：预训练篇

B站高清视频爬取：Python爬虫技术详解

用通义灵码开发一个Python时钟：手把手体验AI程序员加持下的智能编码

6个案例15分钟让你了解Python套路

全面提升Python性能的十三种优化技巧

深入解析：使用 Python 爬虫获取淘宝店铺所有商品接口

Python测试淘宝店铺所有商品接口的详细指南

基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能

milvus-use教程 python

Python爬虫实战：一键采集电商数据，掌握市场动态！

公司电脑网络监控场景下 Python 广度优先搜索算法的深度剖析

相关课程

更多

第八届大学生创新创业大赛阿里命题IoT赛题解析

云计算工程师解析与实战-网络专家篇（体验版）

深入解析Docker容器化技术

Java面试疑难点解析 - 面试技巧及语言基础

Java面试疑难点解析 - Java Web开发

Java面试疑难点解析 - 系统架构及项目设计

相关电子书

更多

神龙云服务器产品及技术深度解析

弹性创造价值：基于ECS的最佳性价比实践解析

又快又稳：阿里云下一代虚拟交换机解析

相关实验场景

更多

用Python画圣诞树

通过云拨测对指定服务器进行Ping/DNS监测

Python选择及循环结构

云端Python及基本操作

Python网络通信程序典型应用

Python新手入门（Anolis OS）

推荐镜像

更多

DNS

python-release

NTP

下一篇

通义万相2.1视频/图像模型新升级！可在阿里云百炼直接体验