python3.6爬虫需要安装的模块

本文涉及的产品
云数据库 MongoDB,通用型 2核4GB
简介:
+关注继续查看

  内置库

        urllib

        re

    需要安装的库

        requests

            pip3 install requests

        selenium

            pip3 install  selenium

        chromedriver

            下载驱动,放在配置好的环境变量下

            http://npm.taobao.org/mirrors/chromedriver/

        phantomjs(无界面浏览器)

            下载,并且配置环境变量

            http://phantomjs.org/

        lxml

            pip3 install lxml

            可能下载失败

            用下面的方式安装

            https://pypi.python.org/pypi/lxml

            

            

            首先安装

            pip3 install wheel

            然后载pip3 install 下载的文件路径和名字

        beautifulsoup4(依赖lxml)

            pip3 install beautifulsoup4

        pyquery

            pip3 install pyquery

    存储库:

        pymysql

            pip3 install pymysql

        pymongo

            pip3 install pymongo

        redis

            pip3 install redis

        flask(代理IP的库)

            pip3 install flask

        django

            pip3 install django

        jupyter(强大的记事本)

            pip3 install jupyter

            jupyter notebook(启动服务)

    框架:

        PySpider

            pip3 install PySpider

        scrapy

            1. wheel

                pip install wheel

            2. lxml

                http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml

            3. PyOpenssl

                https://pypi.python.org/pypi/pyOpenSSL#downloads

            4. Twisted

                http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

                链接:https://pan.baidu.com/s/1oAh2Dse 密码:okk0

            5. Pywin32

                https://sourceforge.net/projects/pywin32/files/pywin32/Build%20220/

                https://sourceforge.net/projects/pywin32/files/pywin32/Build%20221/pywin32-221.win-amd64-py3.6.exe/download

                软件和出现问题修复脚本,

                链接:https://pan.baidu.com/s/1mj2VjxI 密码:ls54

            6. Scrapy

                pip3 install scrapy


 

MongoDB 的安装:



   

启动服务:

    D:\Program Files\MongoDB\Server\3.6\bin>"D:\Program Files\MongoDB\Server\3.6\bin\mongod.exe" --dbpath ../data/db


配置可视化服务:

    建立日志文件在c盘创建C:\data\db文件夹和C:\data\logs\logs.txt文件

    D:\Program Files\MongoDB\Server\3.6\bin>mongod --bind_ip 0.0.0.0 --logpath C:\data\logs\logs.txt  --logappend --dbpath C:\data\db --port 27017 --serviceName "mongodb" --serviceDisplayName "mongodb" --install

 


图形化管理页面软件

    https://download.robomongo.org/1.2.1/windows/robo3t-1.2.1-windows-x86_64-3e50a65.exe



redis数据库安装:


参考上篇博客:    

    http://blog.51cto.com/tdcqvip/2072845


本文转自 天道酬勤VIP 51CTO博客,原文链接:http://blog.51cto.com/tdcqvip/2073149

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
2天前
|
数据采集 安全 Python
Python爬虫遇到重定向URL问题时如何解决?
Python爬虫遇到重定向URL问题时如何解决?
|
2天前
|
数据采集 安全 中间件
python爬虫中 HTTP 到 HTTPS 的自动转换
python爬虫中 HTTP 到 HTTPS 的自动转换
|
18天前
|
数据采集 JavaScript 前端开发
Web爬虫开发指南:使用Python的BeautifulSoup和Requests库
Web爬虫是一种从互联网上获取数据的自动化工具,它可以用于抓取网页内容、提取信息和分析数据。Python提供了一些强大的库,其中BeautifulSoup和Requests是两个常用的工具,用于解析HTML内容和发起HTTP请求。本文将介绍如何使用BeautifulSoup和Requests库构建一个简单而有效的Web爬虫。
|
19天前
|
数据采集 域名解析 网络协议
Python爬虫过程中DNS解析错误解决策略
Python爬虫过程中DNS解析错误解决策略
|
2月前
|
数据采集 数据处理 Python
Python爬虫程序中的504错误:原因、常见场景和解决方法
Python爬虫程序中的504错误:原因、常见场景和解决方法
|
2月前
|
数据采集 机器学习/深度学习 移动开发
python爬虫基础知识
python基础知识简单复习pycharm的简单配置settings->editor->file and code temlates#-*- codeing = utf-8 -*- 编码#@Time : ${DATE} ${TIME} 时间#@Author : chengcheng 作责#@File : ${NAME}.py 文件名#@Software : ${PROJECT_NAM...
36 0
|
2月前
|
数据采集 存储 数据挖掘
Python 爬虫实战之爬拼多多商品并做数据分析
在上面的代码中,我们使用pandas库创建DataFrame存储商品数据,并计算平均价格和平均销量。最后,我们将计算结果打印出来。此外,我们还可以使用pandas库提供的其他函数和方法来进行更复杂的数据分析和处理。 需要注意的是,爬取拼多多商品数据需要遵守拼多多的使用协议和规定,避免过度请求和滥用数据。
|
2月前
|
数据采集 数据挖掘 Python
Python 爬虫实战
Python爬虫可以用于爬取淘宝商品数据,并对这些数据进行数据分析。下面是一个简单的示例,展示如何使用Python爬取淘宝商品数据并进行数据分析。
|
3月前
|
数据采集 存储 大数据
Python爬虫:数据获取与解析的艺术
随着大数据时代的到来,数据的重要性日益凸显。Python作为一种易学易用的编程语言,在数据处理和分析方面有着丰富的库支持。其中,爬虫是获取数据的重要手段之一。本文将介绍Python爬虫的基本概念、常用库以及实战案例。
67 0
|
3月前
|
数据采集 数据安全/隐私保护 Python
python-爬虫-selenium总结
python-爬虫-selenium总结
python-爬虫-selenium总结
推荐文章
更多