开发者社区彭世瑜的博客文章正文

Python编程：scrapy中使用logging，日志出现多次

2022-09-04 333

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Python编程：scrapy中使用logging，日志出现多次

问题

同时使用scrapy.log和logging，日志会多次出现在控制台

import logging
logging.basicConfig(level=logging.DEBUG)
logging.debug("message")

输出的日志

DEBUG:spider:已经处理过了 product_id: 149118
2019-04-09 16:19:19 [spider] DEBUG: 已经处理过了 product_id: 149118

方式一

注释掉日志配置

import logging
# logging.basicConfig(level=logging.DEBUG)
logging.debug("message")

方式二

通过 logger 成功解决

import logging
logger = logging.getLogger(__name__)
logger.setLevel(level=logging.DEBUG)
logger.debug("message")

方式三

比如peewee的日志记录

import logging

logger = logging.getLogger('peewee')
logging.propagate=False # 这是一个布尔标志, 用于指示消息是否传播给父记录器, 默认值为True

文章标签：

日志服务

Python

关键词：

Python编程

Python日志

日志服务logging

Python logging

Python Scrapy

相关实践学习

【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板

码农技术君

土木林森

数据采集存储 JSON

Python网络爬虫：Scrapy框架的实战应用与技巧分享

【10月更文挑战第27天】本文介绍了Python网络爬虫Scrapy框架的实战应用与技巧。首先讲解了如何创建Scrapy项目、定义爬虫、处理JSON响应、设置User-Agent和代理，以及存储爬取的数据。通过具体示例，帮助读者掌握Scrapy的核心功能和使用方法，提升数据采集效率。

土木林森

709 6 6

土木林森

数据采集前端开发中间件

Python网络爬虫：Scrapy框架的实战应用与技巧分享

【10月更文挑战第26天】Python是一种强大的编程语言，在数据抓取和网络爬虫领域应用广泛。Scrapy作为高效灵活的爬虫框架，为开发者提供了强大的工具集。本文通过实战案例，详细解析Scrapy框架的应用与技巧，并附上示例代码。文章介绍了Scrapy的基本概念、创建项目、编写简单爬虫、高级特性和技巧等内容。

土木林森

755 4 4

阮颖松-31785

数据采集数据可视化数据挖掘

基于python django的scrapy去哪儿网数据采集与分析，包括登录注册和可视化大屏，有md5加密

本文介绍了一个基于Python和Django框架，使用Scrapy进行去哪儿网数据采集与分析的项目，包括实现登录注册功能、MD5加密以及通过可视化大屏展示分析结果的综合系统。

阮颖松-31785

345 1 1

基于python django的scrapy去哪儿网数据采集与分析，包括登录注册和可视化大屏，有md5加密

丰宝宝

设计模式 SQL 安全

PHP中的设计模式：单例模式的深入探索与实践在PHP的编程实践中，设计模式是解决常见软件设计问题的最佳实践。单例模式作为设计模式中的一种，确保一个类只有一个实例，并提供全局访问点，广泛应用于配置管理、日志记录和测试框架等场景。本文将深入探讨单例模式的原理、实现方式及其在PHP中的应用，帮助开发者更好地理解和运用这一设计模式。

在PHP开发中，单例模式通过确保类仅有一个实例并提供一个全局访问点，有效管理和访问共享资源。本文详细介绍了单例模式的概念、PHP实现方式及应用场景，并通过具体代码示例展示如何在PHP中实现单例模式以及如何在实际项目中正确使用它来优化代码结构和性能。

丰宝宝

343 2 2

AI研究者手札

数据采集存储中间件

Python进行网络爬虫：Scrapy框架的实践

【8月更文挑战第17天】网络爬虫是自动化程序，用于从互联网收集信息。Python凭借其丰富的库和框架成为构建爬虫的首选语言。Scrapy作为一款流行的开源框架，简化了爬虫开发过程。本文介绍如何使用Python和Scrapy构建简单爬虫：首先安装Scrapy，接着创建新项目并定义爬虫，指定起始URL和解析逻辑。运行爬虫可将数据保存为JSON文件或存储到数据库。此外，Scrapy支持高级功能如中间件定制、分布式爬取、动态页面渲染等。在实践中需遵循最佳规范，如尊重robots.txt协议、合理设置爬取速度等。通过本文，读者将掌握Scrapy基础并了解如何高效地进行网络数据采集。

AI研究者手札

642 6 6

做梦都在改BUG

数据采集存储 JSON

Python爬虫开发：BeautifulSoup、Scrapy入门

在现代网络开发中，网络爬虫是一个非常重要的工具。它可以自动化地从网页中提取数据，并且可以用于各种用途，如数据收集、信息聚合和内容监控等。在Python中，有多个库可以用于爬虫开发，其中BeautifulSoup和Scrapy是两个非常流行的选择。本篇文章将详细介绍这两个库，并提供一个综合详细的例子，展示如何使用它们来进行网页数据爬取。

做梦都在改BUG

646 1 1

做梦都在改BUG

消息中间件 JSON 自然语言处理

python多进程日志以及分布式日志的实现方式

python日志在多进程环境下的问题 python日志模块logging支持多线程，但是在多进程下写入日志文件容易出现下面的问题： PermissionError: [WinError 32] 另一个程序正在使用此文件，进程无法访问。也就是日志文件被占用的情况，原因是多个进程的文件handler对日志文件进行操作产生的。

做梦都在改BUG

641 1 1

众所周知

Python

Python编程实战：利用闭包与装饰器优化日志记录功能

【7月更文挑战第7天】Python的闭包和装饰器简化了日志记录。通过定义如`log_decorator`的装饰器，可以在不修改原函数代码的情况下添加日志功能。当@log_decorator用于`add(x, y)`函数时，调用时自动记录日志。进一步，`timestamp_log_decorator`展示了如何创建特定功能的装饰器，如添加时间戳。这些技术减少了代码冗余，提高了代码的可维护性。

众所周知

392 1 1

东方睿赢

数据采集存储中间件

Scrapy，作为一款强大的Python网络爬虫框架，凭借其高效、灵活、易扩展的特性，深受开发者的喜爱

【6月更文挑战第10天】Scrapy是Python的高效爬虫框架，以其异步处理、多线程及中间件机制提升爬取效率。它提供丰富组件和API，支持灵活的数据抓取、清洗、存储，可扩展到各种数据库。通过自定义组件，Scrapy能适应动态网页和应对反爬策略，同时与数据分析库集成进行复杂分析。但需注意遵守法律法规和道德规范，以合法合规的方式进行爬虫开发。随着技术发展，Scrapy在数据收集领域将持续发挥关键作用。

东方睿赢

430 4 4

土木林森

Java 程序员

技术日志：揭秘Java编程 —— 抽象类与接口的隐藏力量！

【6月更文挑战第17天】在Java编程中，抽象类和接口如同内功心法，增强代码灵活性和维护性。抽象类`Course`定义共性属性和行为，如显示大纲，子类如`ProgrammingCourse`继承并实现细节。接口`Ratable`提供评分功能，允许不同课程以多态方式实现。通过抽象类和接口，代码组织更有序，系统扩展性更强，犹如武侠高手以平凡招式创出非凡武学。不断学习和探索这些技术，能提升编程技艺，应对复杂挑战。

土木林森

201 0 0

Python编程：scrapy中使用logging，日志出现多次

问题

输出的日志

方式一

方式二

方式三

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Python编程：scrapy中使用logging，日志出现多次

问题

输出的日志

方式一

方式二

方式三

热门文章

最新文章

相关课程

相关电子书

推荐镜像