Python爬虫:js的btoa和atob和pythonBase64编码解码比对分析

简介: Python爬虫:js的btoa和atob和pythonBase64编码解码比对分析

比对js和py的Base64编码解码,探求一个共通之处


javascript代码

对英文字符进行base64编码解码

var str = 'javascript';
// 编码
btoa(str)  // "amF2YXNjcmlwdA=="
// 解码
atob("amF2YXNjcmlwdA==")  // "javascript"

对中文字符进行base64编码解码

var str = "China,中国"
btoa(str)
/*
VM156:1 Uncaught DOMException: Failed to execute 'btoa' on 'Window': 
The string to be encoded contains characters outside of the Latin1 range.
*/
// 先对字符串进行编码
encodeURIComponent(str) // "China%EF%BC%8C%E4%B8%AD%E5%9B%BD"
// 编码
btoa(encodeURIComponent(str))  // "Q2hpbmElRUYlQkMlOEMlRTQlQjglQUQlRTUlOUIlQkQ="
// 解码
decodeURIComponent(atob("Q2hpbmElRUYlQkMlOEMlRTQlQjglQUQlRTUlOUIlQkQ="))  // "China,中国"

python3代码

对英文字符进行base64编码解码

import base64
name = "javascript"
# 编码
base64.b64encode(name.encode())  # b'amF2YXNjcmlwdA=='
# 解码
base64.b64decode(b'amF2YXNjcmlwdA==').decode()  # javascript

对中文字符进行base64编码解码


name = "China,中国"
# 编码
base64.b64encode(name.encode())  # b'Q2hpbmHvvIzkuK3lm70='
# 解码
base64.b64decode(b'Q2hpbmHvvIzkuK3lm70=').decode()  # China,中国

总结:

js和py3对英文的处理方式基本一致,编码结果也一样

发现,js对中文编码会报错,py对中文可以直接编码


按照js的思路,先按照URI的编码方式将字符编码


from urllib.request import quote, unquote
name = "China,中国"
# 先对文字进行url方式编码
quote(name)  # 'China%EF%BC%8C%E4%B8%AD%E5%9B%BD'
# 编码
base64.b64encode(quote(name).encode()) 
# b'Q2hpbmElRUYlQkMlOEMlRTQlQjglQUQlRTUlOUIlQkQ='
# 解码
unquote(base64.b64decode(b'Q2hpbmElRUYlQkMlOEMlRTQlQjglQUQlRTUlOUIlQkQ=').decode())
# China,中国

总结:

image.png

其中:

s 表示字符串

b 表示编码后的字符


这样,js和python就可以实现相同的Base64编码解码,可以用于前端代码解码,将js代码转换为python代码


参考


javascript 使用btoa和atob来进行Base64转码和解码

Python编程:URL网址链接中的中文编码与解码

简单明了区分escape、encodeURI和encodeURIComponent

相关文章
|
7月前
|
数据采集 Web App开发 数据安全/隐私保护
实战:Python爬虫如何模拟登录与维持会话状态
实战:Python爬虫如何模拟登录与维持会话状态
|
7月前
|
数据采集 监控 数据库
Python异步编程实战:爬虫案例
🌟 蒋星熠Jaxonic,代码为舟的星际旅人。从回调地狱到async/await协程天堂,亲历Python异步编程演进。分享高性能爬虫、数据库异步操作、限流监控等实战经验,助你驾驭并发,在二进制星河中谱写极客诗篇。
Python异步编程实战:爬虫案例
|
8月前
|
数据采集 存储 XML
Python爬虫技术:从基础到实战的完整教程
最后强调: 父母法律法规限制下进行网络抓取活动; 不得侵犯他人版权隐私利益; 同时也要注意个人安全防止泄露敏感信息.
1038 19
|
7月前
|
数据采集 存储 JSON
Python爬虫常见陷阱:Ajax动态生成内容的URL去重与数据拼接
Python爬虫常见陷阱:Ajax动态生成内容的URL去重与数据拼接
|
7月前
|
数据采集 存储 JavaScript
解析Python爬虫中的Cookies和Session管理
Cookies与Session是Python爬虫中实现状态保持的核心。Cookies由服务器发送、客户端存储,用于标识用户;Session则通过唯一ID在服务端记录会话信息。二者协同实现登录模拟与数据持久化。
|
Rust 算法 安全
【算法】1720. 解码异或后的数组(java / c / c++ / python / go / rust)
未知 整数数组 arr 由 n 个非负整数组成。 经编码后变为长度为 n - 1 的另一个整数数组 encoded ,其中 encoded[i] = arr[i] XOR arr[i + 1] 。例如,arr = [1,0,2,1] 经编码后得到 encoded = [1,2,3] 。 给你编码后的数组 encoded 和原数组 arr 的第一个元素 first(arr[0])。 请解码返回原数组 arr 。可以证明答案存在并且是唯一的。
|
8月前
|
数据采集 机器学习/深度学习 人工智能
Python:现代编程的首选语言
Python:现代编程的首选语言
1350 102
|
8月前
|
数据采集 机器学习/深度学习 算法框架/工具
Python:现代编程的瑞士军刀
Python:现代编程的瑞士军刀
475 104
|
8月前
|
人工智能 自然语言处理 算法框架/工具
Python:现代编程的首选语言
Python:现代编程的首选语言
368 103
|
8月前
|
机器学习/深度学习 人工智能 数据挖掘
Python:现代编程的首选语言
Python:现代编程的首选语言
390 82

推荐镜像

更多