pyquery库和parsel库的使用-阿里云开发者社区

pyquery库和parsel库的使用

2023-02-23 376

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： pyquery库和parsel库的使用

0x01 安装pyquery库

该库可以直接通过css选择器进行字符串查找

pip install pyquery

0x02 初始化操作

通过PyQuery初始化字符串

from pyquery import PyQuery
import requests
url = "https://www.dandanzan10.top/dianying/index.html"
heads = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36',
}
r = requests.get(url, headers=heads)
str = r.text
res=PyQuery(str)
print(res)

0x03 获取电影名字

1、res('h2')：获取h2标签所有内容

2、text()将字符串内容打印出来

from pyquery import PyQuery
import requests
url = "https://www.dandanzan10.top/dianying/index.html"
heads = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36',
}
r = requests.get(url, headers=heads)
str = r.text
res=PyQuery(str)
print(res('h2').text())

运行结果：爱涌情现浪潮时爱的锦囊妙计铁血女王阿米娜：征战天下我的老板是连环杀手国际搜查死亡血路反恐追缉令浅草小子去海边 Reframe THEATER EXPERIENCE with you 凶宅怪谈青涩的伤痛与脆弱狂武藏战地：异种浩劫恋途未卜窒恋路的尽头迷情杀机：卷土重来 BTS舞台舞蹈许可：首尔实时观看父情难却猎杀艾娃最好的女友匹诺曹有一点动心

0x04 安装parsel库

该库是Scrapy框架的底层代码，Scrapy框架是一个爬虫框架，以后我们会详细解说。

pip install parsel

0x05 获取电影名字

1、通Selector初始化一下字符串

2、通过css获取h2标签的所有内容

3、通过xpath获取标签的字符串内容

from parsel import Selector
import requests
url = "https://www.dandanzan10.top/dianying/index.html"
heads = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36',
}
r = requests.get(url, headers=heads)
str = r.text
sl=Selector(text=str)
res=sl.css('h2')
for i in res:
    text=i.xpath('.//text()').get()
    print(text)

0x06 声明

仅供安全研究与学习之用，若将工具做其他用途，由使用者承担全部法律及连带责任，作者不承担任何法律及连带责任。

pyquery库和parsel库的使用

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

pyquery库和parsel库的使用

热门文章

最新文章

相关电子书