网络安全-WEB中的常见编码(2)

简介: 网络安全-WEB中的常见编码(2)

Unicode编码

Unicode编码,又称万国码、国际码、统一码,是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。Unicode 编码共有三种具体实现,分别为utf-8,utf-16,utf-32,其中utf-8占用一到四个字节,utf-16占用二或四个字节,utf-32占用四个字节。

  • UTF-8的特点是对不同范围的字符使用不同长度的编码。
  • UTF-16编码以16位无符号整数为单位。我们把Unicode编码记作U。前缀写为\u、%u。
  • UTF-32编码以32位无符号整数为单位。

Unicode编码与ASCII编码不兼容,但可以转换。

2020062310470442.png

汉字转Unicode编码

“你好”转为Unicode为“\u4f60\u597d”。 下为Python代码:

>>> s = u"\u4f60\u597d"
>>> print(s)
你好

Unicode转ASCII

2020062310470442.png

你好的ASCI编码

HTML编码

使用标签<meta>,例如

<meta charset="utf-8">

除了utf-8,常见的还有

GB2312

发布于1980年,基本集共收入汉字6763个和非汉字图形字符682个。整个字符集分成94个区,每区有94个位。每个区位上只有一个字符,一个字符占两个字节

GBK

GBK全称《汉字内码扩展规范》(GBK即“国标”、“扩展”汉语拼音的第一个字母,英文名称:Chinese Internal Code Specification),发布于1995年,GBK 向下与 GB2312 编码兼容

2020062310470442.png

没找到合适的网站,这个网站也只能一个字,还不如自己敲代码呢。

汉字进行GBK和Unicode编码

>>> s='你好'
>>> s.encode('gbk')
b'\xc4\xe3\xba\xc3'
>>> s.encode('unicode_escape')
b'\\u4f60\\u597d'

                              HTML特殊符号编码表(部分)

image.png

Base编码

Base16

                                  Base16编码表

image.png

2020062310470442.png

汉字的Base16编码

编码原理,先转为ASCII,两个一组,转为2进制,4个一组,转为10进制,查表即可。

使用网站:一个工具箱-Base16

Base32

20210104203500268.jpgBase32编码表

2020062310470442.png

汉字的Base64编码

使用网站:一个工具箱-Base32

Base64

Base64是一种基于64个可打印字符来表示二进制数据的表示方法。3个字节相当于24个比特,对应于4个Base64单元,即3个字节可由4个可打印字符来表示。它可用来作为电子邮件的传输编码。在Base64中的可打印字符包括字母A-Z、a-z、数字0-9,这样共有62个字符,另外两个一般为“+”、"/"。使用“=”作为后缀,如果不够三个字节,即“=”个数为0、1、2。

                                             Base64 编码表

image.png

2020062310470442.png

标题

使用网站:jsons.cn

可尝试“你好”、“i love you too”,观察“=”的个数

还有一些,Base 58、Base 62、Base 85、Base 91、Base 100。例如,比特币使用的是Base58,即123456789ABCDEFGHJKLMNPQRSTUVWXYZabcdefghijkmnopqrstuvwxyz,去除了容易混淆的0、o、I(大写的i)、l(小写的L)。

参考

rfc1738-URL

rfc2045-Base 64

更多内容查看:网络安全-自学笔记

喜欢本文的请动动小手点个赞,收藏一下,有问题请下方评论,转载请注明出处,并附有原文链接,谢谢!如有侵权,请及时联系。






相关文章
|
5月前
|
机器学习/深度学习 计算机视觉
RT-DETR改进策略【模型轻量化】| 替换骨干网络为 MobileViTv1高效的信息编码与融合模块,获取局部和全局信息
RT-DETR改进策略【模型轻量化】| 替换骨干网络为 MobileViTv1高效的信息编码与融合模块,获取局部和全局信息
287 62
RT-DETR改进策略【模型轻量化】| 替换骨干网络为 MobileViTv1高效的信息编码与融合模块,获取局部和全局信息
|
3月前
|
人工智能 运维 安全
网络安全公司推荐:F5荣膺IDC全球Web应用与API防护领导者
网络安全公司推荐:F5荣膺IDC全球Web应用与API防护领导者
77 4
|
5月前
|
机器学习/深度学习 计算机视觉
YOLOv11改进策略【模型轻量化】| 替换骨干网络为 MobileViTv1高效的信息编码与融合模块,获取局部和全局信息
YOLOv11改进策略【模型轻量化】| 替换骨干网络为 MobileViTv1高效的信息编码与融合模块,获取局部和全局信息
192 9
YOLOv11改进策略【模型轻量化】| 替换骨干网络为 MobileViTv1高效的信息编码与融合模块,获取局部和全局信息
|
7月前
|
Kubernetes 安全 Devops
有效抵御网络应用及API威胁,聊聊F5 BIG-IP Next Web应用防火墙
有效抵御网络应用及API威胁,聊聊F5 BIG-IP Next Web应用防火墙
205 10
有效抵御网络应用及API威胁,聊聊F5 BIG-IP Next Web应用防火墙
|
7月前
|
机器学习/深度学习 Serverless 索引
分类网络中one-hot编码的作用
在分类任务中,使用神经网络时,通常需要将类别标签转换为一种合适的输入格式。这时候,one-hot编码(one-hot encoding)是一种常见且有效的方法。one-hot编码将类别标签表示为向量形式,其中只有一个元素为1,其他元素为0。
258 2
|
9月前
|
安全 网络协议 算法
HTTPS网络通信协议揭秘:WEB网站安全的关键技术
HTTPS网络通信协议揭秘:WEB网站安全的关键技术
607 4
HTTPS网络通信协议揭秘:WEB网站安全的关键技术
|
8月前
|
Kubernetes 网络协议 Python
Python网络编程:从Socket到Web应用
在信息时代,网络编程是软件开发的重要组成部分。Python作为多用途编程语言,提供了从Socket编程到Web应用开发的强大支持。本文将从基础的Socket编程入手,逐步深入到复杂的Web应用开发,涵盖Flask、Django等框架的应用,以及异步Web编程和微服务架构。通过本文,读者将全面了解Python在网络编程领域的应用。
127 1
|
9月前
|
JSON API 开发者
深入解析Python网络编程与Web开发:urllib、requests和http模块的功能、用法及在构建现代网络应用中的关键作用
深入解析Python网络编程与Web开发:urllib、requests和http模块的功能、用法及在构建现代网络应用中的关键作用
78 0
|
11月前
|
JavaScript 前端开发 数据库
Tornado框架:异步时代的Web开发,它能否颠覆你的编码世界观?
【8月更文挑战第31天】构建高性能Web应用时,选择合适工具至关重要。Tornado不仅是一个Web框架,还内置高性能HTTP服务器,无需外部依赖即可独立运行,区别于需结合Gunicorn或uWSGI的Django和Flask。本文将探讨Tornado如何革新Web开发,并提供示例。
180 1
|
11月前
|
数据库 开发者 Python
Python网络编程:Web框架基础(Flask/Django)
Python作为一种功能强大且易于使用的编程语言,广泛应用于Web开发领域。Python的丰富生态系统中,有两个非常流行的Web框架:Flask和Django。本博文将详细介绍这两个框架的基础知识,并通过综合示例展示如何使用它们构建Web应用。

热门文章

最新文章