CSS基本选择
1.通用选择器
response.css("*").extract()
2. 类型选择
选择指定标签的内容
<input></input>
.css(“div”)或者 response.css(“input”)
3. 类Class选择器
选择指定类的内容
<div class = "pic"></div>
Response.css(".pic")
4.ID选择器
选择指定ID的内容
<div id="pic"></div>
Response.css("#pic")
5.属性选择Attr选择器
按照给定的属性,选择所有匹配的元素。
语法:[attr] [attr=value] [attr~=value] [attr|=value] [attr^=value] [attr$=value] [attr*=value]
6.分组选择器
使用逗号分隔不同标签, 可以同时匹配到二者任意元素
Reponse.css(“div, span”)
6.后代组合器
组合选择前一个元素的后代节点, 匹配所有位于任意<div>元素之内的<span>
Reponse.css(“div span”)
7.直接子代组合器
组合选择前一个元素的直接子代节点, 匹配直接嵌套在 <ul> 元素内的所有 <li> 元素。
Response.css(“ul > li”)
7.一般兄弟组合器
选择兄弟元素,也就是说,后一个节点在前一个节点后面的任意位置,并且共享同一个父节点。匹配同一父元素下,<p> 元素后的所有 <span> 元素。
Reponse.css(“p ~ span”)
7.紧邻兄弟组合器
选择相邻元素,即后一个元素紧跟在前一个之后,并且共享同一个父节点。会匹配所有紧邻在 <h2> 元素后的 <p> 元素。
Response.css(“h2 + p”)
7.列组合器
选择属于某个表格行的节点。 会匹配所有 <col> 作用域内的 <td> 元素。
Response.css(“co || td”)
7.伪选择器
:: 伪选择器用于表示无法用 HTML 语义表达的实体。匹配所有 <p> 元素的第一行。
Response.css(“p::first-line”)