常用的xpath

简介: 常用的xpath

一、xpath 语法

简单看一下菜鸟教程即可

1、基本语法

XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。 下面列出了最有用的路径表达式:

表达式 描述
nodename 选取此节点的所有子节点。
/ 从根节点选取(取子节点)。
// 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置(取子孙节点)。
. 选取当前节点。
.. 选取当前节点的父节点。
@ 选取属性。

2、基本语法-谓语(Predicates)

谓语用来查找某个特定的节点或者包含某个指定的值的节点。

谓语被嵌在方括号中。

在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果:

路径表达式 结果
/bookstore/book[1] 选取属于 bookstore 子元素的第一个 book 元素。
/bookstore/book[last()] 选取属于 bookstore 子元素的最后一个 book 元素。
/bookstore/book[last()-1] 选取属于 bookstore 子元素的倒数第二个 book 元素。
//title[@lang] 选取所有拥有名为 lang 的属性的 title 元素。
//title[@lang='eng'] 选取所有 title 元素,且这些元素拥有值为 eng 的 lang 属性。


☺ 二、项目xpath 的常用场景

1、多个相同标签的选择

(1) contains ()方法:包含某个内容的标签

--举例1:
xpath("//div[@class='row']/div[contains(@class, 'search-results')]")
xpath("//p//strong[contains(text(), "Release date")]")
  • 举例2:

(2) 通过节点序号获取到第几个子节点

--举例1:
xpath("//div[@class='result'][1]/h1/a/text()")
  • 举例2:

(3) following-sibling:: 获取同级的标签

--举例1:
xpath("//p//strong[contains(text(), "Release date")]//following-sibling::i[1]")
  • 举例2:

我们公司的项目,引入的xpath的依赖的那个版本,它对xpath的解析,和谷歌浏览器看到有点不同,比如这个following-sibling::a,谷歌会取到所有a标签,但是项目中,只取第一个a标签。


2、项目中常用的方法、谓语

text() 取到文本内容

@属性 比如 @class、@href @title

following-sibling 获取同级元素

contains方法 对多个相同元素进行判断后选择

node() 获取所有节点

count方法 计算数量

postion方法 判断位置

  • 举例:
xpath2("//p//strong[contains(text(), "Genre:")]//following-sibling::a[position()<(count(//p//strong[contains(text(), "Genre:")]//following-sibling::node())-count(//p//strong[contains(text(), "Genre:")]//following-sibling::br[1]//following-sibling::node()))*0.5]")

如果xpath 使用报错,就使用xpath2,公司项目中引入了xpath2的依赖


3、xpath 字符串相关函数

和java的String的一些函数差不多!

举例拼接字符串 concat方法

xpath("//div[@class='row']/div[@class='search-results']/div[@class='result'][1]/h1/a/text()")
xpath2("concat('本周Steam值得关注的游戏',//div[@class='row']/div[contains(@class, 'search-results')]/div[@class='result'][1]/h1/a/text())")

判断是否存在字符串 contains方法

...


三、写xpath 常用的工具---谷歌浏览器

示例:



如果本文对你有帮助的话记得给一乐点个赞哦,感谢!

目录
相关文章
|
2月前
PAT 1001 和 1002 A+B问题
PAT 1001 和 1002 A+B问题
|
3月前
|
SQL 分布式计算 HIVE
ApacheHudi使用问题汇总(一)
ApacheHudi使用问题汇总(一)
35 0
|
机器学习/深度学习 人工智能 文字识别
超全干货分享:什么是RPA?
7月28日,阿里云RPA4.0版本重磅发布,为企业数字化转型提供高效、安全、可靠的服务。RPA是一款软件机器人,能够模拟人的行为完成软件的交互,能够解决跨系统、跨平台,重复有规律的工作流程。时至今日,阿里云RPA已被超过50万各行各业的用户采用,可以跟踪到的执行总次数已突破120亿次,用户使用RPA获得了3-10倍的效率提升
11019 0
超全干货分享:什么是RPA?
PAUSE
PAUSE
94 0
|
SQL Java 数据库连接
JPA
JPA
141 1
Pangram
Pangram
112 0
Pangram
|
算法
PAT条条大路通罗马
Indeed there are many different tourist routes from our city to Rome. You are supposed to find your clients the route with the least cost while gaining the most happiness.
109 0
|
机器人
你真的了解RPA吗?
RPA(Robotic Process Automation),译为机器人流程自动化,也可称为数字化劳动力(Digital Labor),是一种智能化软件,它可以像人类一样,通过简单的编程来完成设定好的任务流程,优化整个企业的基础流程作业,降低成本、提高效率。
2108 0
|
Serverless Java Spring
回顾过去看应用PaaS的Next
和上周那篇回顾过去看IaaS的Next一样,这篇我将通过回顾我自己所经历的应用PaaS的发展,来找找应用PaaS发展的动力,从而更好的寻找创新方向。
1749 0
PathAnimation
原文:PathAnimation 使用Blend制作PathAnimation 1:选中Path转换为运动路径 2:选择目标对象   PathAnimation使用动态的Path PathAnimation动画在播放的时候,PahtGeometry是已经确定的,不会改变,不会实时的根据Pa...
882 0