文档备案控制台

开发者社区大数据文章正文

python抓取网页图片

2013-08-10 1193

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

# -*- coding: utf-8 -*-  
#---------------------------------------  
#   程序：网页图片抓取
#   作者：lqf  
#   日期：2013-08-10  
#   语言：Python 2.7  
#   功能：抓取网页jpg链接图片
#---------------------------------------  
import re
import string
import sys
import os
import urllib

url="http://tieba.baidu.com/p/2521298181"#这个是某贴吧地址
imgcontent=urllib.urlopen(url).read()#抓取网页内容
urllist=re.findall(r'src="(http.+?\.jpg)"',imgcontent,re.I)#提取图片链接
if not urllist:
	print 'not found...'
else:
	#下载图片,保存在当前目录的pythonimg文件夹下
	filepath=os.getcwd()+'\pythonimg'
	if os.path.exists(filepath) is False:
		os.mkdir(filepath)
	x=1
	print u'爬虫准备就绪...'
	for imgurl in urllist:
		temp= filepath + '\%s.jpg' % x
		print u'正在下载第%s张图片' % x
		print imgurl
		urllib.urlretrieve(imgurl,temp)
		x+=1
	print u'图片下载完毕，保存路径为'+filepath

文章标签：

Python

数据采集

关键词：

Python网页

Python图片

Python抓取

Python网页图片

Python抓取网页

动感小前端

目录

相关文章

一个程序员

|

7月前

|

机器学习/深度学习编解码 Python

Python图片上采样工具 - RealESRGANer

Real-ESRGAN基于深度学习实现图像超分辨率放大，有效改善传统PIL缩放的模糊问题。支持多种模型版本，推荐使用魔搭社区提供的预训练模型，适用于将小图高质量放大至大图，放大倍率越低效果越佳。

一个程序员

543 3 3

站大爷

|

7月前

|

机器学习/深度学习文字识别 Java

Python实现PDF图片OCR识别：从原理到实战的全流程解析

本文详解2025年Python实现扫描PDF文本提取的四大OCR方案（Tesseract、EasyOCR、PaddleOCR、OCRmyPDF），涵盖环境配置、图像预处理、核心识别与性能优化，结合财务票据、古籍数字化等实战场景，助力高效构建自动化文档处理系统。

站大爷

1831 0 1

小白学大数据

|

8月前

|

数据采集存储 JSON

地区电影市场分析：用Python爬虫抓取猫眼/灯塔专业版各地区票房

地区电影市场分析：用Python爬虫抓取猫眼/灯塔专业版各地区票房

小白学大数据

755 2 2

小白学大数据

|

8月前

|

数据采集存储 XML

Python爬虫XPath实战：电商商品ID的精准抓取策略

Python爬虫XPath实战：电商商品ID的精准抓取策略

小白学大数据

756 0 0

小白学大数据

|

9月前

|

数据采集存储 NoSQL

Python爬虫案例：Scrapy+XPath解析当当网网页结构

Python爬虫案例：Scrapy+XPath解析当当网网页结构

小白学大数据

400 0 0

小白学大数据

|

9月前

|

数据采集存储监控

Python爬虫实战：批量下载亚马逊商品图片

Python爬虫实战：批量下载亚马逊商品图片

小白学大数据

479 0 0

小白学大数据

|

11月前

|

数据采集存储前端开发

Python爬虫自动化：批量抓取网页中的A链接

Python爬虫自动化：批量抓取网页中的A链接

小白学大数据

539 4 5

小白学大数据

|

10月前

|

数据采集 Web App开发 JavaScript

Python爬虫解析动态网页：从渲染到数据提取

Python爬虫解析动态网页：从渲染到数据提取

小白学大数据

764 0 1

Deephub

|

11月前

|

存储机器学习/深度学习人工智能

多模态RAG实战指南：完整Python代码实现AI同时理解图片、表格和文本

本文探讨了多模态RAG系统的最优实现方案，通过模态特定处理与后期融合技术，在性能、准确性和复杂度间达成平衡。系统包含文档分割、内容提取、HTML转换、语义分块及向量化存储五大模块，有效保留结构和关系信息。相比传统方法，该方案显著提升了复杂查询的检索精度（+23%），并支持灵活升级。文章还介绍了查询处理机制与优势对比，为构建高效多模态RAG系统提供了实践指导。

Deephub

2617 0 0

多模态RAG实战指南：完整Python代码实现AI同时理解图片、表格和文本

车厘子v

|

数据采集 Python Windows

python爬虫-抓取百度贴吧帖子图片

本爬虫可以爬取百度贴吧帖子中的图片，代码有待完善，欢迎大家指教！出处：https://github.com/jingsupo/python-spider/blob/master/day03/07tieba.

车厘子v

1278 0 0

热门文章

最新文章

教你用Python发现即将流失的客户（附代码、安装教程、学习资源）

python基础---函数

python正则表达式修复网站文章字体不统一问题

Python 3.3版发布

【第1讲】Python3.11的下载、安装和卸载，有手就能学会

算法之【动态规划】详解（python）

gitlab-ci的简易入门—基于python项目的CI演示

Python之函数

笨办法学 Python · 续第四部分：进阶项目

python趣味编程：借书方案(排列组合)

基于python大数据的台风灾害分析及预测系统

基于Python大数据的热门游戏推荐系统

基于python大数据的青少年网络使用情况分析及预测系统

2026版基于python大数据的电影分析可视化系统

基于Python大数据的的电商用户行为分析系统

基于python大数据技术的医疗数据分析与研究

基于python大数据深度学习的酒店评论文本情感分析系统

Python SQLAlchemy模块：从入门到实战的数据库操作指南

基于python大数据的的海洋气象数据可视化平台

基于Python大数据的主流汽车价格分析可视化系统

相关课程

更多

Python爬虫实战

Python开发基础入门

Python常用数据科学库

Python网络爬虫实战

Python完全自学手册图文教程

Python基础快速入门实战教程

相关电子书

更多

From Python Scikit-Learn to Sc

Data Pre-Processing in Python:

双剑合璧-Python和大数据计算平台的结合

推荐镜像

更多

python-release

下一篇

开通oss服务