备案控制台

开发者社区开发与运维文章正文

【Python爬虫】用beautifulsoup4库遇到的错误及处理

2023-07-28 127

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 在这里对使用beautifulsoup时遇到的问题进行汇总。

在这里对使用beautifulsoup时遇到的问题进行汇总。

问题：爬取网页时使用CSS选择器，代码如下，报错 NotImplementedError: Only the following pseudo-classes are implemented: nth-of-type.

title = soup.select('.newsTable > tbody:nth-child(1) > tr:nth-child(1) > td:nth-child(1)')

处理：nth-child改为nth-of-type

问题：爬取网页时使用CSS选择器，代码如下，打印出来是[]。

title = soup.select('.newsTable > tbody:nth-of-type(1) > tr:nth-of-type(1) > td:nth-of-type(1)')

处理：路径改为 .newsTable > tbody > t > td。要把所有子节点（nth-child）去掉。还有div的前后都要有空格，不然报错。

文章标签：

Python

前端开发

数据采集

关键词：

Python爬虫

Python库

爬虫python

Python爬虫库

爬虫库

橙长在互联网时代

目录

相关文章

爱专研的技术土狗

|

1月前

|

数据采集存储 XML

Python爬虫：深入探索1688关键词接口获取之道

在数字化经济中，数据尤其在电商领域的价值日益凸显。1688作为中国领先的B2B平台，其关键词接口对商家至关重要。本文介绍如何通过Python爬虫技术，合法合规地获取1688关键词接口，助力商家洞察市场趋势，优化营销策略。

爱专研的技术土狗

80 3 4

vohelon

|

27天前

|

XML JSON 数据库

Python的标准库

Python的标准库

vohelon

168 77 77

API小知识

|

1天前

|

数据采集供应链 API

Python爬虫与1688图片搜索API接口：深度解析与显著收益

在电子商务领域，数据是驱动业务决策的核心。阿里巴巴旗下的1688平台作为全球领先的B2B市场，提供了丰富的API接口，特别是图片搜索API（`item_search_img`），允许开发者通过上传图片搜索相似商品。本文介绍如何结合Python爬虫技术高效利用该接口，提升搜索效率和用户体验，助力企业实现自动化商品搜索、库存管理优化、竞品监控与定价策略调整等，显著提高运营效率和市场竞争力。

API小知识

15 2 2

小白学大数据

|

12天前

|

数据采集存储缓存

如何使用缓存技术提升Python爬虫效率

如何使用缓存技术提升Python爬虫效率

小白学大数据

36 2 2

小白学大数据

|

13天前

|

数据采集 Web App开发监控

Python爬虫：爱奇艺榜单数据的实时监控

Python爬虫：爱奇艺榜单数据的实时监控

小白学大数据

58 3 3

爱专研的技术土狗

|

22天前

|

数据采集 JSON API

如何利用Python爬虫淘宝商品详情高级版（item_get_pro）API接口及返回值解析说明

本文介绍了如何利用Python爬虫技术调用淘宝商品详情高级版API接口（item_get_pro），获取商品的详细信息，包括标题、价格、销量等。文章涵盖了环境准备、API权限申请、请求构建和返回值解析等内容，强调了数据获取的合规性和安全性。

爱专研的技术土狗

75 13 13

冷冻工厂

|

2月前

|

机器学习/深度学习算法数据挖掘

数据分析的 10 个最佳 Python 库

数据分析的 10 个最佳 Python 库

冷冻工厂

105 4 4

数据分析的 10 个最佳 Python 库

vohelon

|

28天前

|

XML JSON 数据库

Python的标准库

Python的标准库

vohelon

49 11 11

蚝油菜花

|

2月前

|

人工智能 API 开发工具

aisuite：吴恩达发布开源Python库，一个接口调用多个大模型

吴恩达发布的开源Python库aisuite，提供了一个统一的接口来调用多个大型语言模型（LLM）服务。支持包括OpenAI、Anthropic、Azure等在内的11个模型平台，简化了多模型管理和测试的工作，促进了人工智能技术的应用和发展。

蚝油菜花

141 1 1

aisuite：吴恩达发布开源Python库，一个接口调用多个大模型

蓝易云

|

28天前

|

数据可视化 Python

以下是一些常用的图表类型及其Python代码示例，使用Matplotlib和Seaborn库。

通过这些思维导图和分析说明表，您可以更直观地理解和选择适合的数据可视化图表类型，帮助更有效地展示和分析数据。

蓝易云

66 8 8

热门文章

最新文章

Java爬虫：数据采集的强大工具

Java爬虫：深入解析商品详情的利器

Python 爬虫必备杀器，xpath 解析 HTML

Python爬虫：深入探索1688关键词接口获取之道

利用Python爬虫获取1688关键词接口全攻略

网页爬虫技术全解析：从基础到实战

如何利用Python爬虫淘宝商品详情高级版（item_get_pro）API接口及返回值解析说明

Python爬虫京东商品详情数据接口

Python爬虫能处理动态加载的内容吗？

Referer头部在网站反爬虫技术中的运用

Python 密码学实用指南（全）（2）

【python】习题第10周

【python】习题第8周

【python】习题第7周（上）

【python】习题 6-10周（下）

【python】习题 6-10周（中）

Python 入门指南（七）（4）

【python】习题 1-5周（中）

【python】习题 1-5周（上）

Python 入门指南（七）（2）

相关课程

更多

Python Web开发基础

Python开发基础入门

Python常用数据科学库

Python网络爬虫实战

Python完全自学手册图文教程

Python基础快速入门实战教程

相关电子书

更多

From Python Scikit-Learn to Sc

Data Pre-Processing in Python:

双剑合璧-Python和大数据计算平台的结合

相关实验场景

更多

用Python画圣诞树

Python选择及循环结构

云端Python及基本操作

Python网络通信程序典型应用

Python新手入门（Anolis OS）

Python新手入门

推荐镜像

更多

python-release

nodejs-release

golang

下一篇

DataWorks智能交互式数据开发与分析之旅