11.6. xpath

简介:

11.6.1. 逻辑运算符

11.6.1.1. and

				
>>> response.xpath('//span[@class="time" and @id="news-time"]/text()').extract()
['2017-10-09 09:46']				
				
				

11.6.1.2. or

				
//*[@class='foo' or contains(@class,' foo ') or starts-with(@class,'foo ') or substring(@class,string-length(@class)-3)=' foo']				
				
				

11.6.2. function

11.6.2.1. text()

				
>>> response.xpath('//title/text()').extract_first()
'Netkiller ebook - Linux ebook'				
				
				

11.6.2.2. contains()

contains() 匹配含有特定字符串的 class

				
//*[contains(@class,'foo')]
								
				
				
>>> response.xpath('//ul[contains(@class, "topnews_nlist")]/li/h2/a/@href|//ul[contains(@class, "topnews_nlist")]/li/a/@href').extract()	
				
				

内容匹配

				
>>> response.xpath('//div[@id="epContentLeft"]/h1[contains(text(),"10")]/text()').extract()
['美联储10月起启动渐进式缩表 维持基准利率不变']					
				
			





原文出处:Netkiller 系列 手札
本文作者:陈景峯
转载请与作者联系,同时请务必标明文章原始出处和作者信息及本声明。

目录
相关文章
|
5月前
PAT 1001 和 1002 A+B问题
PAT 1001 和 1002 A+B问题
P9094 [PA2020] Mieszanie kolorów
P9094 [PA2020] Mieszanie kolorów
|
6月前
|
SQL 分布式计算 HIVE
ApacheHudi使用问题汇总(一)
ApacheHudi使用问题汇总(一)
50 0
|
XML 数据格式
PAUSE
PAUSE
103 0
|
机器人
你真的了解RPA吗?
RPA(Robotic Process Automation),译为机器人流程自动化,也可称为数字化劳动力(Digital Labor),是一种智能化软件,它可以像人类一样,通过简单的编程来完成设定好的任务流程,优化整个企业的基础流程作业,降低成本、提高效率。
2134 0
|
负载均衡 分布式数据库 数据库
spanner 的前世今生
spanner的前身是big table,让我们先来看看big table这个老子的方方面面,然后再来看看儿子spanner为啥一出世就吸引了全球技术人员的眼球。 2006年,google 发表了big table [1]的文章,为什么要做big table,下面有一个简短的总结[2]: 就
9603 3
PathAnimation
原文:PathAnimation 使用Blend制作PathAnimation 1:选中Path转换为运动路径 2:选择目标对象   PathAnimation使用动态的Path PathAnimation动画在播放的时候,PahtGeometry是已经确定的,不会改变,不会实时的根据Pa...
904 0
|
XML 数据格式 .NET