python_cookie

简介: cookielib是一个自动处理cookies的模块## 核心类CookieJar:是cookie的集合,可以包含很多Cookie类,是我们的主要操作对象FileCookieJar:继承自CookieJar,CookieJar只是在内存中完成自己的生命周期,FileCookieJar的子类可...

cookielib是一个自动处理cookies的模块
## 核心类

  • CookieJar:是cookie的集合,可以包含很多Cookie类,是我们的主要操作对象
  • FileCookieJar:继承自CookieJar,CookieJar只是在内存中完成自己的生命周期,FileCookieJar的子类可以实现数据持久化,定义了save,load,revert三个接口
  • Cookie:可以理解为某一条cookie数据
  • CookiePolicy:主要功能是收发cookie,即确保正确的cookie发往对应的域名
  • DefaultCookiePolicy:实现CookiePolicy的接口

Cookie库

参见Python中Cookie的处理(一)Cookie库

  • expires是cookie的生存周期,path是cookie的有效路径,domain是cookie的有效域.
  • 路径"path"用于设置可以读取一个cookie的最顶层的目录.将cookie的路径设置为你的网页最顶层的目录可以让该该目录下的所有网页都能访问该cookie.
  • 方法:在你的cookie中加入path=/; 如果你只想让"food" 目录中的网页可以使用该cookie,则你加入path=/food.
  • domain:有些网站有许多小的域名,例如百度可能还在"news.baidu.com" "zhidao.baidu.com" 和"v.baidu.com" 域名下有网页.如果想让"baidu.com"下的所有机器都可以读取该cookie,必须在cookie中加入 "domain=.baidu.com" .
  • 用户浏览器会存储Cookie直到过期,浏览器会向符合path和domain的服务器发送类似以下内容的HTTP请求报头:
    Cookie:session=8345234

Cookie用于服务器实现会话,用户登录及相关功能时进行状态管理。要在用户浏览器上安装cookie,HTTP服务器向HTTP响应添加类似以下内容的HTTP报头:
Set-Cookie:session=8345234;expires=Sun,15-Nov-2013 15:00:00 GMT;path=/;domain=baidu.com

cookie字符串通常位于HTTP_COOKIE环境变量中,可以如下读取:

import os
print("Content-type: text/plain\n")
if "HTTP_COOKIE" in os.environ:
    print(os.environ["HTTP_COOKIE"])
else:
    print("HTTP_COOKIE not set!")
Content-type: text/plain

HTTP_COOKIE not set!
  • Python中Cookie模块(python3中为http.cookies)提供了一个类似字典的特殊对象SimpleCookie,其中存储并管理着称为Morsel的cookie值集合。
    • 每个Morsel都有name,value以及可选属性(expires,path,domain,comment,max-age,secure,version,httponly)。
    • SimpleCookie可使用output()方法创建以HTTP报头形式表示的cookie数据输出,用js_output()方法生成包含javascript代码的字符串。

HTTP_COOKIE生成cookie

cookie=http.cookies.SimpleCookie(os.environ['HTTP_COOKIE'])
print(cookie.output())
import http
import datetime
import random

expiration = datetime.datetime.now() + datetime.timedelta(days=30)
cookie = http.cookies.SimpleCookie()
cookie["session"] = random.randint(1,1000000000)
cookie["session"]["domain"] = ".baidu.com"
cookie["session"]["path"] = "/"
cookie["session"]["expires"] = expiration.strftime("%a, %d-%b-%Y %H:%M:%S PST")

print("Content-type: text/plain")
print(cookie.output())
print()
print("Cookie set with: " + cookie.output())
Content-type: text/plain
Set-Cookie: session=965495731; Domain=.baidu.com; expires=Tue, 19-Sep-2017 17:05:16 PST; Path=/

Cookie set with: Set-Cookie: session=965495731; Domain=.baidu.com; expires=Tue, 19-Sep-2017 17:05:16 PST; Path=/

Python中cookielib库

(python3中为http.cookiejar)为存储和管理cookie提供客户端支持。

  • 该模块主要功能是提供可存储cookie的对象。使用此模块捕获cookie并在后续连接请求时重新发送,还可以用来处理包含cookie数据的文件。
  • 这个模块主要提供了这几个对象,CookieJar,FileCookieJar,MozillaCookieJar,LWPCookieJar。

CookieJar

    CookieJar对象存储在内存中。

import urllib
import http
cookie=http.cookiejar.CookieJar()
handler=urllib.request.HTTPCookieProcessor(cookie)
opener=urllib.request.build_opener(handler)
opener.open('https://www.bing.com/academic/?FORM=Z9LH2')
<http.client.HTTPResponse at 0x29ded3de9e8>

访问google的cookie已经被捕捉了,来看下是怎样的:

print(cookie)
<CookieJar[<Cookie MUID=08CCD96B384A6BE137DED38F39EB6A29 for .bing.com/>, <Cookie SRCHD=AF=Z9LH2 for .bing.com/>, <Cookie SRCHUID=V=2&GUID=9CB95C78423040E9AE1C98EB5C804D08&dmnchg=1 for .bing.com/>, <Cookie SRCHUSR=DOB=20170820 for .bing.com/>, <Cookie _EDGE_S=F=1&SID=36AFD21E071366A817D4D8FA06B26782 for .bing.com/>, <Cookie _EDGE_V=1 for .bing.com/>, <Cookie _SS=SID=36AFD21E071366A817D4D8FA06B26782 for .bing.com/>, <Cookie MUIDB=08CCD96B384A6BE137DED38F39EB6A29 for www.bing.com/>]>

看来是Cookie实例的集合,Cookie实例有name,value,path,expires等属性:

for ck in cookie:
    print(ck.name,':',ck.value)
MUID : 08CCD96B384A6BE137DED38F39EB6A29
SRCHD : AF=Z9LH2
SRCHUID : V=2&GUID=9CB95C78423040E9AE1C98EB5C804D08&dmnchg=1
SRCHUSR : DOB=20170820
_EDGE_S : F=1&SID=36AFD21E071366A817D4D8FA06B26782
_EDGE_V : 1
_SS : SID=36AFD21E071366A817D4D8FA06B26782
MUIDB : 08CCD96B384A6BE137DED38F39EB6A29

将cookie捕捉到文件

  • FileCookieJar(filename)
    创建FileCookieJar实例,检索cookie信息并将信息存储到文件中,filename是文件名。
  • MozillaCookieJar(filename)
    创建与Mozilla cookies.txt文件兼容的FileCookieJar实例。
  • LWPCookieJar(filename)
    创建与libwww-perl Set-Cookie3文件兼容的FileCookieJar实例。
import urllib
import http
def HandleCookie():
    #handle cookie whit file
    filename='FileCookieJar.txt'
    url='https://www.bing.com/academic/?FORM=Z9LH2'
    F=http.cookiejar.LWPCookieJar(filename)
    F.save()
    op=urllib.request.build_opener(urllib.request.HTTPCookieProcessor(F))
    op.open(url)
    F.save()
    print(open(filename).read())
    
if __name__ == "__main__":
    HandleCookie()
#LWP-Cookies-2.0
Set-Cookie3: MUID=1097D83A72366E4E02FDD2DE73976F64; path="/"; domain=".bing.com"; path_spec; expires="2019-08-20 10:17:53Z"; version=0
Set-Cookie3: SRCHD="AF=Z9LH2"; path="/"; domain=".bing.com"; path_spec; domain_dot; expires="2019-08-20 10:17:52Z"; version=0
Set-Cookie3: SRCHUID="V=2&GUID=38595011EA2B450DA8FC8089DB92E687&dmnchg=1"; path="/"; domain=".bing.com"; path_spec; domain_dot; expires="2019-08-20 10:17:52Z"; version=0
Set-Cookie3: SRCHUSR="DOB=20170820"; path="/"; domain=".bing.com"; path_spec; domain_dot; expires="2019-08-20 10:17:52Z"; version=0
Set-Cookie3: _EDGE_V=1; path="/"; domain=".bing.com"; path_spec; expires="2019-08-20 10:17:53Z"; httponly=None; version=0
Set-Cookie3: MUIDB=1097D83A72366E4E02FDD2DE73976F64; path="/"; domain="www.bing.com"; path_spec; expires="2019-08-20 10:17:53Z"; httponly=None; version=0
探寻有趣之事!
目录
相关文章
|
4月前
|
前端开发
Promise.all()方法接收的可迭代对象中,如果有一个Promise被拒绝,会发生什么?
Promise.all()方法接收的可迭代对象中,如果有一个Promise被拒绝,会发生什么?
266 108
|
12月前
|
存储 Java C#
深入理解synchronized实现原理
本文深入讲解了Java中`synchronized`关键字的实现原理。`synchronized`确保同一时刻只有一个线程能进入临界区,并保证共享变量的内存可见性。它通过monitor机制实现,作用于方法时使用ACC_SYNCHRONIZED标志,作用于代码块时使用monitorenter和monitorexit指令。每个对象都有一个与之关联的monitor,线程需获取monitor锁才能执行同步代码。Monitor内部包含_EntryList、_Owner、_WaitSet等队列,管理线程的加锁、等待和唤醒过程。
266 0
深入理解synchronized实现原理
|
9月前
|
云安全 运维 监控
阿里云安全体检评测报告:一次深入的云上“体检”体验
阿里云安全体检评测报告:一次深入的云上“体检”体验
205 1
阿里云安全体检评测报告:一次深入的云上“体检”体验
|
消息中间件 Kafka Python
Producer的错误处理与重试机制
【8月更文第29天】在分布式系统中,消息传递是核心组件之一,它通常通过消息队列(如 Kafka、RabbitMQ 或其他)来实现。当生产者尝试将消息发送到消息队列时,可能会遇到各种类型的故障,例如网络中断、服务器不可用等。为了确保消息的可靠传递,需要实现有效的错误处理和重试机制。
528 2
|
算法 C语言
C语言中的文件操作技巧,涵盖文件的打开与关闭、读取与写入、文件指针移动及注意事项
本文深入讲解了C语言中的文件操作技巧,涵盖文件的打开与关闭、读取与写入、文件指针移动及注意事项,通过实例演示了文件操作的基本流程,帮助读者掌握这一重要技能,提升程序开发能力。
719 3
|
存储 开发工具 git
Git和SVN有什么区别?
综上所述,选择Git还是SVN取决于项目的具体需求、团队规模以及工作习惯。Git因其高级特性和灵活性,成为了现代软件开发中更受欢迎的选择,而SVN在某些特定场景下仍保有一席之地。开发者应当根据实际情况,权衡两者之间的优劣,作出最适合项目的选择。
495 4
|
Rust 安全 C++
系统编程的未来之战:Rust能否撼动C++的王座?
【8月更文挑战第31天】Rust与C++:现代系统编程的新选择。C++长期主导系统编程,但内存安全问题频发。Rust以安全性为核心,通过所有权和生命周期概念避免内存泄漏和野指针等问题。Rust在编译时确保内存安全,简化并发编程,其生态系统虽不及C++成熟,但发展迅速,为现代系统编程提供了新选择。未来有望看到更多Rust驱动的系统级应用。
316 1
|
安全 JavaScript 数据可视化
Axure高端交互元件库:助力产品与设计
为了在这个竞争激烈的市场中脱颖而出,设计师和产品开发团队需要依赖强大的工具来创造引人注目且功能丰富的交互界面。下面介绍一款Axure精心制作的"Web高端交互元件库",作为一款高端交互元件库已被很多设计者使用,它成为了产品与设计团队不可或缺的得力助手。
413 2
|
存储 NoSQL 算法
使用图数据库进行复杂数据建模:探索数据关系的无限可能
【8月更文挑战第17天】图数据库以其高效的关系查询能力、直观的数据表示方式、灵活的数据模型和强大的可扩展性,在复杂数据建模和查询中展现出了巨大的潜力。随着大数据和人工智能技术的不断发展,图数据库的应用领域也将不断拓展和深化。对于需要处理复杂关系网络和数据关联性的场景来说,图数据库无疑是一个值得深入研究和应用的强大工具。
|
机器学习/深度学习 人工智能 运维
智能化运维:AI在IT管理中的创新应用
【7月更文挑战第15天】本文探讨了人工智能(AI)如何革新传统的IT运维模式,通过智能自动化、实时分析和预测性维护,显著提高运维效率和准确性。文章将深入分析AI技术在故障检测与解决、资源优化配置以及安全监控等方面的具体应用案例,并讨论实施AI时可能遇到的挑战和解决方案。
419 2