scrapy MysqlPipeline 同步和异步-阿里云开发者社区

scrapy MysqlPipeline 同步和异步

2017-11-09 1660

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

云数据库 RDS MySQL，集群系列 2核4GB

RDS MySQL Serverless 高可用系列，价值2615元额度，1个月

简介：

 
        import MySQLdb
       
        import MySQLdb.cursors
       
        class 
        MysqlPipeline(object): 
       
        #采用同步的机制写入mysql 
       
        def __init__(self): 
       
        self.conn = MySQLdb.connect(
        '192.168.0.106'
        , 
        'root'
        , 
        'root'
        , 
        'article_spider'
        , charset=
        "utf8"
        , use_unicode=True) 
       
        self.cursor = self.conn.cursor() 
       
        def process_item(self, item, spider): 
       
        insert_sql = 
        ""
        " 
       
        insert into jobbole_article(title, url, create_date, fav_nums) 
       
        VALUES (%s, %s, %s, %s) 
       
        ""
        " 
       
        self.cursor.execute(insert_sql, (item[
        "title"
        ], item[
        "url"
        ], item[
        "create_date"
        ], item[
        "fav_nums"
        ])) 
       
        self.conn.commit() 
       
        class 
        MysqlTwistedPipline(object): 
       
        def __init__(self, dbpool): 
       
        self.dbpool = dbpool 
       
        @classmethod 
       
        def from_settings(cls, settings): 
       
        dbparms = dict( 
       
        host = settings[
        "MYSQL_HOST"
        ], 
       
        db = settings[
        "MYSQL_DBNAME"
        ], 
       
        user = settings[
        "MYSQL_USER"
        ], 
       
        passwd = settings[
        "MYSQL_PASSWORD"
        ], 
       
        charset=
        'utf8'
        , 
       
        cursorclass=MySQLdb.cursors.DictCursor, 
       
        use_unicode=True, 
       
        ) 
       
        dbpool = adbapi.ConnectionPool(
        "MySQLdb"
        , **dbparms) 
       
        return 
        cls(dbpool) 
       
        def process_item(self, item, spider): 
       
        #使用twisted将mysql插入变成异步执行 
       
        query = self.dbpool.runInteraction(self.do_insert, item) 
       
        query.addErrback(self.handle_error, item, spider) #处理异常 
       
        def handle_error(self, failure, item, spider): 
       
        # 处理异步插入的异常 
       
        print (failure) 
       
        def do_insert(self, cursor, item): 
       
        #执行具体的插入 
       
        #根据不同的item 构建不同的sql语句并插入到mysql中 
       
        insert_sql, params = item.get_insert_sql() 
       
        print (insert_sql, params) 
       
        cursor.execute(insert_sql, params)

 
         本文转自ning1022 51CTO博客，原文链接：http://blog.51cto.com/ning1022/1925593
   ，如需转载请自行联系原作者

相关实践学习

如何快速连接云数据库RDS MySQL

本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL，然后进行数据表的CRUD操作。

全面了解阿里云能为你做什么

阿里云在全球各地部署高效节能的绿色数据中心，利用清洁计算为万物互联的新世界提供源源不断的能源动力，目前开服的区域包括中国（华北、华东、华南、香港）、新加坡、美国（美东、美西）、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程，来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品：云服务器ECS 云服务器 ECS（Elastic Compute Service）是一种弹性可伸缩的计算服务，助您降低 IT 成本，提升运维效率，使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs

scrapy MysqlPipeline 同步和异步

热门文章

最新文章

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

scrapy MysqlPipeline 同步和异步

热门文章

最新文章

相关电子书