UTF-8笔记170330

简介: unicode为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的UTF-8使用可变长度字节来储存Unicode字符,例如ASCII字母继续使用1字节储存,重音文字、希腊字母或西里尔字母等使用2字节来储存,而常用的汉字就要使用3字节。





unicode


为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的

UTF-8使用可变长度字节来储存 Unicode字符,例如ASCII字母继续使用1字节储存,重音文字、希腊字母或西里尔字母等使用2字节来储存,而常用的汉字就要使用3字节。辅助平面字符则使用4字节

RFC 3629utf8


UTF-8Unicode的一种实现方式,也就是它的字节结构有特殊要求,所以我们说一个汉字的范围是0X4E000x9FA5(其实还包括了中日韩的),是指unicode值,至于放在utf-8的编码里去就是由三个字节来组织,所以可以看出unicode是给出一个字符的范围,定义了这个字是码值是多少,至于具体的实现方式可以有多种多样来实现。

1字节 7   0xxxxxxx 
2
字节 11 110xxxxx 10xxxxxx 
3
字节 16 1110xxxx 10xxxxxx 10xxxxxx 
4
字节 21 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx 
5
字节 26 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 
6
字节 31 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 

目录
相关文章
|
消息中间件 存储 负载均衡
Rabbitmq direct模式保证一个队列只对应一个消费者
Rabbitmq direct模式保证一个队列只对应一个消费者
737 0
|
9月前
|
数据采集 机器学习/深度学习 人工智能
SkyReels-V1:短剧AI革命来了!昆仑开源视频生成AI秒出影视级短剧,比Sora更懂表演!
SkyReels-V1是昆仑万维开源的首个面向AI短剧创作的视频生成模型,支持高质量影视级视频生成、33种细腻表情和400多种自然动作组合。
1244 92
SkyReels-V1:短剧AI革命来了!昆仑开源视频生成AI秒出影视级短剧,比Sora更懂表演!
|
12月前
|
移动开发 人工智能 物联网
移动应用与系统:探索现代移动开发的趋势与挑战####
本文深入探讨了当前移动应用开发和移动操作系统的最新趋势、技术挑战及未来展望。通过分析Android、iOS等主流平台的演进,以及跨平台开发工具的兴起,揭示了开发者在构建高性能、安全且用户友好的移动应用时面临的机遇与挑战。文章还强调了人工智能、物联网集成及5G技术如何重塑移动生态系统,为读者提供了一个全面的行业视角。 ####
|
机器学习/深度学习 编解码 边缘计算
深度学习在图像处理中的应用与展望##
本文旨在探讨深度学习技术在图像处理领域的应用及其未来发展趋势。通过分析卷积神经网络(CNN)等关键技术,展示了深度学习如何提升图像识别、分类和生成等任务的性能。同时,本文也讨论了当前面临的挑战和未来的研究方向,为相关领域的研究和实践提供参考。 ##
|
缓存 JSON 安全
深入了解 Elasticsearch:10个常见面试问题及详细答案
Elasticsearch 是一个强大的搜索和分析引擎,广泛应用于处理大型数据集和构建实时搜索应用程序。在准备 Elasticsearch 面试时,掌握一些常见问题的答案至关重要。本文将为你提供10个常见的 Elasticsearch 面试问题,并详细解答每个问题。
|
JavaScript
小而美的IKUN-UI组件库源码学习(前言)
小而美的IKUN-UI组件库源码学习(前言)
366 0
小而美的IKUN-UI组件库源码学习(前言)
|
数据安全/隐私保护
STM32F103C8T6实现简易密码锁(CubeMax配置)(一),Oled显示。
项目功能:实现设置密码,登陆密码,后期还可以通过E2PROM实现掉电不丢失数据。通过Oled的显示去判断我们是否设置或者登陆成功。
501 0
|
JSON 前端开发 Java
Springboot整合JWT
Springboot整合JWT
177 0
|
移动开发 前端开发 IDE
前端知识笔记(三十四)———HBuilder的下载与使用(详细步骤)
前端知识笔记(三十四)———HBuilder的下载与使用(详细步骤)
752 0
|
Kubernetes 监控 Linux
K8S与docker的区别?
K8S与docker的区别?