文档备案控制台

开发者社区云计算文章正文

Beauiful Soup

2023-02-19 171

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Beautiful Soup的简单使用

Beautiful Soup的基本用法

soup = BeautifulSoup(html, 'lxml')
print (soup.prettify())
print(soup.title.string)
简单解析：通过传入html字符串生成一个Beautiful对象，调用prettify可以输出并格式化，使其对其，但要注意，自动更正格式在对象初始化时就已经完成。调用soup.title.string就是输出HTML中title结点的文本内容。

结点选择器

直接调用结点的名称就可以选择结点元素，再调用string属性就可以得到结点的内容，如果结构非常清晰的话，可以选用这种方式，不仅可以用string来获取文本的值，还可以通过属性名称来获取属性的值，首先要获取名称，我们可以通过调用结点的name属性来获取属性名称，再根据属性名称来获取属性的值，获取属性时，每个结点可能又多个结点元素调用attrs来获取所有属性，也可以进行嵌套选择，比如获取head结点时，我们还可以继续获取head内部中的结点元素。
关联选择，当我们选择元素时并不能选到想要的结点元素，先选中一个元素，然后再以它的基准再选择它的子节点，父节点，兄弟结点，比如我们在获取p结点的所有直接子节点时，可以调用contents属性，返回结果是列表形式，p结点即包含文本，又包含结点，最后将他们以列表形式统一返回。

方法选择器

findall（），查询所有符合条件的元素，给他传入一些属性或文本，可以得到符合条件的元素
用法find_all(name，attrs，recursive,text,**kwags)
find()返回第一个元素，而不是一个列表。

游客vchhg2ptkd6kw

目录

相关文章

三分钟热度的鱼

|

存储 Java Maven

Spring Cloud Alibaba服务问题之服务报错如何解决

Spring Cloud Alibaba提供了一套在Spring Cloud框架基础上构建的微服务解决方案，旨在简化分布式系统的开发和管理；本合集将探讨Spring Cloud Alibaba在实际应用中的部署和使用技巧，以及该框架常见问题的诊断方法和解决步骤。

三分钟热度的鱼

443 85 147

xibeijing

|

安全关系型数据库 API

深入理解后端技术：构建高效、可靠的服务器端应用

本文将深入探讨后端技术的核心概念和最佳实践，包括服务器端编程、数据库管理、API设计与开发等方面。我们将从基础开始，逐步深入，帮助读者建立起对后端开发的全面理解，从而能够独立构建高效、可靠的服务器端应用。

xibeijing

489 32 32

mrq4nk6ni2neg

|

存储 Python

Python编程入门：从零开始的代码之旅

【9月更文挑战第4天】本文将带领初学者步入Python的世界，通过简明的语言和直观的例子，逐步揭示编程的乐趣。我们将一起构建基础的数据结构，探索控制语句的奥秘，并实现简单的函数。无论你是编程新手还是希望巩固基础，这篇文章都是你理想的起点。让我们开始吧，一步步将代码块搭建成思维的宫殿！

mrq4nk6ni2neg

169 2 3

请看我回答~

|

机器学习/深度学习人工智能自动驾驶

深度学习中的图像识别技术及其应用

【8月更文挑战第28天】在人工智能的浪潮中，深度学习技术以其强大的数据处理能力成为焦点。特别是图像识别领域，深度学习不仅推动了技术的发展，也深刻影响了我们的生活和工作方式。本文将深入探讨深度学习在图像识别中的应用及其背后的技术原理，同时提供代码示例以加深理解。

请看我回答~

174 1 2

涂作权

|

Java Maven

查找maven中的groupId，artifactId，version等信息的方式

可以查看：http://search.maven.org/ 输入要想找的东西

涂作权

2491 0 0

陈俊刚

|

JavaScript

【Vue】自动导入组件

当我们在Vue项目中使用第三方库或组件时，通常需要手动导入它们并在需要的地方进行注册。这可能会变得繁琐和冗长，特别是当我们使用大量的第三方库或组件时。为了简化这个过程，我们可以使用unplugin-auto-import和unplugin-vue-components插件。

陈俊刚

393 0 0

是阿超

|

Android开发

Android调用相机与相册的方法2

Android调用相机与相册的方法

是阿超

191 0 0

開发-I88I9Z88OZ4

|

存储人工智能安全

DAPP博饼交易所系统开发|案例分析|规则指南

Web3.0的出现将带来新型互联网商业模式，改变现有的商业模式和产业格局。Web3.0中智能合约和去中心化应用将极大地降低运营成本、提升效率和可信度，今后的以数据为中心的服务和分布式应用、智能城市等领域，将会有更多的创新和探索。

開发-I88I9Z88OZ4

222 0 0

Withcomb

|

算法 Java

了解AQS

Withcomb

239 0 0

auqbllxiu

|

分布式计算 Kubernetes Apache

《Apache Spark on Kubernetes》电子版地址

Apache Spark on Kubernetes

auqbllxiu

160 0 0

《Apache Spark on Kubernetes》电子版地址

热门文章

最新文章

ccxt中文教程

CC：基于组件总线的Android组件化开源框架

SQL SERVER数据库删除LOG文件和清空日志的方案

Linux系统小技巧（1）：/dev/random设备可能导致java程序启动慢或者操作耗时不正常

RestHighLevelClient查询es

Linux系统检查查看桌面环境

面对复杂业务，if-else coder 如何升级？

RESTful API 文档生成神器 Wisdom REST Client

输出某种编码的字符串

Script:partition table into rowid extent chunks

大模型微调内存优化全攻略：无需昂贵显卡，打造你的AI助手

《面向第三方的GraphQL开放平台设计指南：安全可控治理手册》

《GraphQL 强类型架构下的错误处理体系设计指南》

【Azure Function】在Azure上的 Python Function 资源被扫描出包含安全漏洞

给AI模型“加外挂”：LoRA技术详解，让小白也能定制自己的大模型

说话就能让AI写出顶级代码？Vercel官方经验包来了

Apache Tomcat 历史版本下载地址官网地址

OpenClaw(Clawdbot)零基础部署指南+OpenClaw Skills 官方技能解析，1条命令解锁全能AI

从“通才”到“专才”：揭秘AI大模型预训练与微调的核心魔法

阿里云OpenClaw（Clawdbot）保姆级教程：3步部署+3个必装Skill+5个实战案例，从新手到高手

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

第五届伏魔挑战赛如约来袭，诚邀各路高手来战！