python urllib模块学习笔记

简介:

这个模块是最基本最常用的,以前看过,总结一下

复制代码
#  coding : utf-8
import urllib

url =  ' http://cnblogs.com '

# 代理服务器
proxies = { ' http ': ' http://127.0.0.1:8087 '}
# 使用代理服务器打开
r = urllib.urlopen(url,proxies = proxies)

print r.info()
print r.getcode()
print r.geturl()

# 打开本地文件
f = urllib.urlopen(url =  ' file:/home/ma6174/a.sh ')
print f.read()

# 打开ftp
#
f = urllib.urlopen(url = 'ftp://username:password@ftpaddress')

# 保存网页并显示进度
def cbk(a, b, c):
         '''
        a: num
        b: size
        c: total
        
'''
        per = 100.0*a*b/c
         if per > 100:
                per = 100
         print  ' %.2f%% ' % per

local =  ' cnblogs.html '
urllib.urlretrieve(url,local,cbk)

# get方法
params = urllib.urlencode({ ' spam ': 1,  ' eggs ': 2,  ' bacon ': 0})
f = urllib.urlopen( " http://www.musi-cal.com/cgi-bin/query?%s " % params)
print f.read()

# post方法
params = urllib.urlencode({ ' spam ': 1,  ' eggs ': 2,  ' bacon ': 0})
f = urllib.urlopen( " http://www.musi-cal.com/cgi-bin/query ", params)
print f.read()

# 编码解码
data =  ' name = ~a+3 '  

data1 = urllib.quote(data)   
print data1  #  result: name%20%3D%20%7Ea%2B3   
print urllib.unquote(data1)  #  result: name = ~a+3   
  
data2 = urllib.quote_plus(data)   
print data2  #  result: name+%3D+%7Ea%2B3   
print urllib.unquote_plus(data2)     #  result: name = ~a+3   
  
data3 = urllib.urlencode({  ' name '' dark-bull '' age ': 200 })   
print data3  #  result: age=200&name=dark-bull   
  
data4 = urllib.pathname2url(r ' d:/a/b/c/23.php ')   
print data4  #  result: ///D|/a/b/c/23.php   
print urllib.url2pathname(data4)     #  result: D:/a/b/c/23.php  
复制代码


博主ma6174对本博客文章(除转载的)享有版权,未经许可不得用于商业用途。转载请注明出处http://www.cnblogs.com/ma6174/

对文章有啥看法或建议,可以评论或发电子邮件到ma6174@163.com


本文转自ma6174博客园博客,原文链接:http://www.cnblogs.com/ma6174/archive/2012/07/24/2606018.html ,如需转载请自行联系原作者
相关文章
|
2月前
|
开发者 Python
如何在Python中管理模块和包的依赖关系?
在实际开发中,通常会结合多种方法来管理模块和包的依赖关系,以确保项目的顺利进行和可维护性。同时,要及时更新和解决依赖冲突等问题,以保证代码的稳定性和可靠性
59 4
|
22天前
|
Python
Python Internet 模块
Python Internet 模块。
119 74
|
2月前
|
算法 数据安全/隐私保护 开发者
马特赛特旋转算法:Python的随机模块背后的力量
马特赛特旋转算法是Python `random`模块的核心,由松本真和西村拓士于1997年提出。它基于线性反馈移位寄存器,具有超长周期和高维均匀性,适用于模拟、密码学等领域。Python中通过设置种子值初始化状态数组,经状态更新和输出提取生成随机数,代码简单高效。
123 63
|
2月前
|
测试技术 Python
手动解决Python模块和包依赖冲突的具体步骤是什么?
需要注意的是,手动解决依赖冲突可能需要一定的时间和经验,并且需要谨慎操作,避免引入新的问题。在实际操作中,还可以结合使用其他方法,如虚拟环境等,来更好地管理和解决依赖冲突😉。
|
1天前
|
Python
[oeasy]python057_如何删除print函数_dunder_builtins_系统内建模块
本文介绍了如何删除Python中的`print`函数,并探讨了系统内建模块`__builtins__`的作用。主要内容包括: 1. **回忆上次内容**:上次提到使用下划线避免命名冲突。 2. **双下划线变量**:解释了双下划线(如`__name__`、`__doc__`、`__builtins__`)是系统定义的标识符,具有特殊含义。
15 3
|
2月前
|
持续交付 Python
如何在Python中自动解决模块和包的依赖冲突?
完全自动解决所有依赖冲突可能并不总是可行,特别是在复杂的项目中。有时候仍然需要人工干预和判断。自动解决的方法主要是提供辅助和便捷,但不能完全替代人工的分析和决策😉。
|
2月前
|
数据可视化 Python
如何在Python中解决模块和包的依赖冲突?
解决模块和包的依赖冲突需要综合运用多种方法,并且需要团队成员的共同努力和协作。通过合理的管理和解决冲突,可以提高项目的稳定性和可扩展性
|
3月前
|
JSON API 开发者
深入解析Python网络编程与Web开发:urllib、requests和http模块的功能、用法及在构建现代网络应用中的关键作用
深入解析Python网络编程与Web开发:urllib、requests和http模块的功能、用法及在构建现代网络应用中的关键作用
29 0
|
Web App开发 数据采集 数据格式
Python爬虫二(Urllib库的基本使用和高级用法)
转载:静觅 » Python爬虫入门三之Urllib库的基本使用 转载:静觅 » Python爬虫入门四之Urllib库的高级用法 1.分分钟扒一个网页下来 怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS、CSS,如果把网页比作一个人,那么HTML便
1758 0