Beauiful Soup

简介: Beautiful Soup的简单使用

Beautiful Soup的基本用法

soup = BeautifulSoup(html, 'lxml')
print (soup.prettify())
print(soup.title.string)
简单解析:通过传入html字符串生成一个Beautiful对象,调用prettify可以输出并格式化,使其对其,但要注意,自动更正格式在对象初始化时就已经完成。调用soup.title.string就是输出HTML中title结点的文本内容。

结点选择器

直接调用结点的名称就可以选择结点元素,再调用string属性就可以得到结点的内容,如果结构非常清晰的话,可以选用这种方式 ,不仅可以用string来获取文本的值,还可以通过属性名称来获取属性的值,首先要获取名称,我们可以通过调用结点的name属性来获取属性名称,再根据属性名称来获取属性的值,获取属性时,每个结点可能又多个结点元素调用attrs来获取所有属性,也可以进行嵌套选择,比如获取head结点时,我们还可以继续获取head内部中的结点元素。
关联选择,当我们选择元素时并不能选到想要的结点元素,先选中一个元素,然后再以它的基准再选择它的子节点,父节点,兄弟结点,比如我们在获取p结点的所有直接子节点时,可以调用contents属性,返回结果是列表形式,p结点即包含文本,又包含结点,最后将他们以列表形式统一返回。

方法选择器

findall(),查询所有符合条件的元素,给他传入一些属性或文本,可以得到符合条件的元素
用法find_all(name,attrs,recursive,text,**kwags)
find()返回第一个元素,而不是一个列表。

相关文章
|
存储 Java Maven
Spring Cloud Alibaba服务问题之服务报错如何解决
Spring Cloud Alibaba提供了一套在Spring Cloud框架基础上构建的微服务解决方案,旨在简化分布式系统的开发和管理;本合集将探讨Spring Cloud Alibaba在实际应用中的部署和使用技巧,以及该框架常见问题的诊断方法和解决步骤。
|
12月前
|
安全 关系型数据库 API
深入理解后端技术:构建高效、可靠的服务器端应用
本文将深入探讨后端技术的核心概念和最佳实践,包括服务器端编程、数据库管理、API设计与开发等方面。我们将从基础开始,逐步深入,帮助读者建立起对后端开发的全面理解,从而能够独立构建高效、可靠的服务器端应用。
284 0
|
存储 Python
Python编程入门:从零开始的代码之旅
【9月更文挑战第4天】本文将带领初学者步入Python的世界,通过简明的语言和直观的例子,逐步揭示编程的乐趣。我们将一起构建基础的数据结构,探索控制语句的奥秘,并实现简单的函数。无论你是编程新手还是希望巩固基础,这篇文章都是你理想的起点。让我们开始吧,一步步将代码块搭建成思维的宫殿!
100 2
|
机器学习/深度学习 人工智能 自动驾驶
深度学习中的图像识别技术及其应用
【8月更文挑战第28天】在人工智能的浪潮中,深度学习技术以其强大的数据处理能力成为焦点。特别是图像识别领域,深度学习不仅推动了技术的发展,也深刻影响了我们的生活和工作方式。本文将深入探讨深度学习在图像识别中的应用及其背后的技术原理,同时提供代码示例以加深理解。
|
JavaScript
【Vue】自动导入组件
当我们在Vue项目中使用第三方库或组件时,通常需要手动导入它们并在需要的地方进行注册。这可能会变得繁琐和冗长,特别是当我们使用大量的第三方库或组件时。为了简化这个过程,我们可以使用unplugin-auto-import和unplugin-vue-components插件。
294 0
|
Java Maven
查找maven中的groupId,artifactId,version等信息的方式
可以查看:http://search.maven.org/   输入要想找的东西 
2412 0
|
Android开发
Android调用相机与相册的方法2
Android调用相机与相册的方法
134 0
|
存储 人工智能 安全
DAPP博饼交易所系统开发|案例分析|规则指南
Web3.0的出现将带来新型互联网商业模式,改变现有的商业模式和产业格局。Web3.0中智能合约和去中心化应用将极大地降低运营成本、提升效率和可信度,今后的以数据为中心的服务和分布式应用、智能城市等领域,将会有更多的创新和探索。
|
算法 Java
了解AQS
了解AQS
190 0
|
分布式计算 Kubernetes Apache