配置 BeautifulSoup

简介:

首先,安装Beautifulsoup

    pip  install  beautifulsoup4


然后初始化对象

    from  bs4  import  BeautifulSoup

    file = BeautifulSoup(open("index.html"))     #此处传入文件,红色部分为要传入的页面源码文件

    string = BeautifulSoup("<html>data</html>")  #此处红色部分传入一个字符串


可以通过 .标签名 向下深入, 如 : file.p.a.span


遍历:

    html 文件有标签,字符串等组成,遍历时可以同级遍历,也可以跨级遍历。

    同级遍历: .previous_sibling   

               .next_sibling


    跨级遍历:

               向父级遍历:

                    .parent

               向子级遍历:    

                    .contents   #以列表形式遍历,通过一个列表将结果展示出来

                    .children   #以生成器形式遍历,比较节省内存

    本文转自   tianshuai369   51CTO博客,原文链接:http://blog.51cto.com/songqinglong/1739483


相关文章
|
存储 Prometheus 监控
高可用prometheus集群方案选型分享
高可用prometheus集群方案选型分享
7050 2
高可用prometheus集群方案选型分享
如何给 NPM 设置代理
GFW 蛋疼的把 https://registry.npmjs.org 给墙了,导致无法通过 NPM 安装模块。
3919 0
|
5月前
|
人工智能 IDE API
10行代码,实现你的专属阿里云OpenAPI MCP Server
本文介绍如何用10行Python代码创建专属阿里云OpenAPI MCP Server。针对传统MCP Server工具固化、开发复杂等问题,提出借助alibaba-cloud-ops-mcp-server实现灵活拓展的方案。通过配置服务与API名称,运行简短代码即可生成支持SSE连接的MCP Server。用户无需深入了解阿里云OpenAPI细节,大幅降低开发门槛。未来将探索通用工具设计,实现固定工具调用任意API,进一步提升灵活性与效率。
|
存储 Python
数据包络分析(Data Envelopment Analysis, DEA)详解与Python代码示例
数据包络分析(Data Envelopment Analysis, DEA)详解与Python代码示例
|
存储 安全 网络协议
Elasticsearch - Configuring security in Elasticsearch 开启用户名和密码访问
Elasticsearch - Configuring security in Elasticsearch 开启用户名和密码访问
378 0
|
8天前
|
人工智能 运维 安全
|
6天前
|
人工智能 异构计算
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!
|
7天前
|
机器学习/深度学习 人工智能 自然语言处理
B站开源IndexTTS2,用极致表现力颠覆听觉体验
在语音合成技术不断演进的背景下,早期版本的IndexTTS虽然在多场景应用中展现出良好的表现,但在情感表达的细腻度与时长控制的精准性方面仍存在提升空间。为了解决这些问题,并进一步推动零样本语音合成在实际场景中的落地能力,B站语音团队对模型架构与训练策略进行了深度优化,推出了全新一代语音合成模型——IndexTTS2 。
639 22
|
7天前
|
人工智能 测试技术 API
智能体(AI Agent)搭建全攻略:从概念到实践的终极指南
在人工智能浪潮中,智能体(AI Agent)正成为变革性技术。它们具备自主决策、环境感知、任务执行等能力,广泛应用于日常任务与商业流程。本文详解智能体概念、架构及七步搭建指南,助你打造专属智能体,迎接智能自动化新时代。