带你读《全景揭秘字符编码》之八:八、常见字符编码2:ISO-8859系列

简介: 带你读《全景揭秘字符编码》之八:八、常见字符编码2:ISO-8859系列

八、常见字符编码2:ISO-8859系列


美国市场虽然统一了字符编码,但是计算机制造商在进入欧洲市场的时候又遇到了麻烦。。。


欧洲的主流语言虽然也是用拉丁字母,但却存在很多扩展体,比如法语的“é”,挪威语中的“Å”,都无法用 ASCII 表示。但是大家发现ASCII后面的128个还没有被使用可以利用起来,这对于欧洲主流语言就足够了。


于是就有了大家所熟知的这个ISO-8859-1(Latin-1),它只是扩展了ASCII后128个字符,还是属于单字节编码。同时为了兼容原先的 ASCII码,当最高位是0的时候仍然表示原先的 ASCII 字符不变,当最高位是1的时候表示扩展的欧洲字符。



但是到这里还没有完:刚说了这只是欧洲主流的语言,但主流语言里没有法语使用的 œ、Œ、Ÿ 三个字母,也没有芬兰语使用的 Š、š、Ž、ž ,而单字节编码里的256个码点都被用完了,于是就出现了更多的变种 ISO-8859-2/3/.../16 系列,他们都兼容 ASCII,但彼此间又不完全兼容。


ISO-8859-n系列字符集如下:


  • 1)ISO8859-1 字符集,也就是 Latin-1,是西欧常用字符,包括德法两国的字母;
  • 2)ISO8859-2 字符集,也称为 Latin-2,收集了东欧字符;
  • 3)ISO8859-3 字符集,也称为 Latin-3,收集了南欧字符;
  • 4)ISO8859-4 字符集,也称为 Latin-4,收集了北欧字符;
  • 5)ISO8859-5 字符集,也称为 Cyrillic,收集了斯拉夫语系字符;
  • 6)ISO8859-6 字符集,也称为 Arabic,收集了阿拉伯语系字符;
  • 7)ISO8859-7 字符集,也称为 Greek,收集了希腊字符;
  • .......
相关文章
|
Java 开发者 Spring
Spring Boot 实现解耦和隔离的技术指南
【6月更文挑战第13天】Spring Boot 作为一种流行的 Java 框架,通过其强大的依赖注入和配置管理功能,使得开发者可以轻松实现模块之间的解耦和隔离
500 3
|
定位技术 Python
福利!基于 ArcGIS Pro 的Python 教学书籍开放下载
福利!基于 ArcGIS Pro 的Python 教学书籍开放下载
665 1
|
移动开发 算法 前端开发
|
安全 大数据
数据集不是“越多越好”:微调里最容易被误解的一件事
微调中数据非“越多越好”,而是“越清楚越好”。它本质是约束而非燃料:重目标一致性、表达稳定性与边界清晰度,而非规模。小而精的数据更易定位问题、验证假设;盲目扩量反致模型平均化、难调试、掩盖目标缺陷。关键在明确“教模型什么”,而非堆砌数量。
|
11月前
|
人工智能 自然语言处理 Serverless
Vibecoding 新体验:实测 Qwen3 Coder 代码生成效果
Qwen3 Coder 是一款强大的编程大语言模型,支持超长 1M 上下文,具备卓越的代码生成能力。结合 VibeCoding 方案,可助力开发者与企业快速构建复杂应用,实现自然语言生成系统,提升开发效率与生产力。
|
Java 测试技术 开发者
Java零基础-indexOf(String str)详解!
【10月更文挑战第13天】Java零基础教学篇,手把手实践教学!
567 1
|
运维 安全 网络安全
绿盟防火墙忘记密码串口重置
绿盟防火墙忘记密码串口重置
|
安全 关系型数据库 MySQL
mysql 安装插件 validate_password
mysql 安装插件 validate_password
1271 0
在 ArkTS 中,如何有效地进行内存管理和避免内存泄漏?
【9月更文挑战第25天】在ArkTS中,有效进行内存管理并避免内存泄漏的方法包括:及时释放不再使用的资源,如关闭监听器和清理定时器;避免循环引用,通过弱引用打破循环;合理使用单例模式,确保单例对象正确释放;及时处理不再使用的页面和组件,在卸载时清理相关资源。
763 9
|
算法 搜索推荐
数据结构与算法学习十八:堆排序
这篇文章介绍了堆排序是一种通过构建堆数据结构来实现的高效排序算法,具有平均和最坏时间复杂度为O(nlogn)的特点。
691 0
数据结构与算法学习十八:堆排序

热门文章

最新文章