Unicode 14 标准发布

简介: Unicode 14 标准发布

本文为翻译,原文地址Unicode 博客: 宣布 Unicode ® 标准, 版本 14.0

Unicode 标准版本 14.0 现已可用,包括核心规范、附件和数据文件。此版本增加了 838 个字符,总共为 144697 个字符。这些新增内容包括 5 个新脚本,共 159 个脚本,以及 37 个新表情符号字符。

第 14.0 版中的新脚本和字符为波斯尼亚、印度、印度尼西亚、伊朗、爪哇、马来西亚、蒙古、缅甸、巴基斯坦和菲律宾的现代语言群体以及非洲和北美的其他语言增加了支持,包括:

  • 阿拉伯文字的添加,包括荣誉和添加的古兰经使用,以及字符用于写整个非洲,巴尔干,南亚和东南亚的语言
  • Vithkuqi 脚本历史上用于写阿尔巴尼亚语, 目前正在经历现代复兴
  • 唐萨语剧本用来写唐萨语,在印度和缅甸使用
  • 托托脚本用于在印度东北部编写托托语
  • 扩展 IPA 的许多拉丁文脚本添加

热门符号添加包括:

其他符号和符号添加包括:

  • 吉尔吉斯共和国使用的索姆货币标志
  • 兹纳门尼音乐符号在俄罗斯开发

对其他现代语言和学术工作的支持扩展到世界各地,包括:

  • Cypro-米诺安,历史上主要在塞浦路斯岛使用
  • 古老的维吾尔语,历史上在中亚和其他地方用来写突厥语、汉语、蒙古语、藏语和阿拉伯语
  • 阿霍姆语、巴厘岛语、婆罗门语、加拿大土著语言语、格拉戈利蒂语、凯提语、卡纳达语、蒙古语、塔加禄语、塔克里语和泰卢古语
  • 阿拉伯语支持豪萨、沃洛夫、欣德科和旁遮普, 以及埃西奥皮克对古拉格的支持

重要图表字体更新,包括:

  • 对 CJK 辅助块和封闭的字母数字进行重大更新

Unicode 属性和规格决定了计算机和手机上的文本行为。第 14.0 版的更改包括以下 Unicode 标准附件和技术标准,这些附件进行了显著修改:为第 14.0 版更新了五个重要的 Unicode 附件:

为版本 14.0 更新的三个重要 Unicode 规范:

Unicode 标准是全球所有现代软件和通信的基础,包括操作系统、浏览器、笔记本电脑和智能手机以及互联网和 Web(网环、HTML、XML、CSS、JSON 等)。Unicode 标准及其相关标准和数据构成了 CLDR 和 ICU 发布的基础。


相关文章
|
1天前
|
文件存储
Unicode标准与其他编码规则
Unicode标准与其他编码规则
7 0
|
3月前
|
存储 自然语言处理
字符编码问题之Unicode传统字符编码方案中的语言编码冲突如何解决
字符编码问题之Unicode传统字符编码方案中的语言编码冲突如何解决
49 1
|
3月前
字符编码问题之GBK确保与ASCII码的兼容性如何解决
字符编码问题之GBK确保与ASCII码的兼容性如何解决
42 0
|
3月前
字符编码问题之GB2312编码设计来避免与ASCII字符编码冲突如何解决
字符编码问题之GB2312编码设计来避免与ASCII字符编码冲突如何解决
59 0
|
6月前
再见手动编码,标准自动化编码规则来帮忙!
标准管理员小S面临数据标准编码管理的挑战:编码格式不统一、编码值不可读活相关性差,手动管理耗时易出错。Dataphin新推出“标准编码规则”功能,可以实现一次配置批量生成编码,并通过自增序列、固定字符串和所属标准集编码的组合,保证编码相关性和灵活性,同时提供了编码规则变更后的批量订正功能,大大简化管理工作。小S对此表示高度满意。
140 0
|
Java 机器人 Windows
【IntelliJ IDEA】UTF-8编码下\u7528\u6237转换为中文汉字,\u9489\u9489\u81EA\u5B9A\u4E49\(Unicode字符与中文的相互转化)
【IntelliJ IDEA】UTF-8编码下\u7528\u6237转换为中文汉字,\u9489\u9489\u81EA\u5B9A\u4E49\(Unicode字符与中文的相互转化)
928 0
|
XML 存储 安全
Unicode 15.0 标准已发布,新增鹅、豌豆等 20个emoji
Unicode 15.0 标准已发布,新增鹅、豌豆等 20个emoji
467 0
|
存储 Windows
“浅入深处“编码历史,字符串编码(ASCII, GBK, ANSI, Unicode, UTF-8编码),为什么记事本默认ANSI编码,Unicode和UTF8有什么区别
“浅入深处“编码历史,字符串编码(ASCII, GBK, ANSI, Unicode, UTF-8编码),为什么记事本默认ANSI编码,Unicode和UTF8有什么区别
141 0
|
JavaScript 前端开发
前端培训-中级阶段 (16)-Unicode和UTF 编码
前端最基础的就是 HTML+CSS+Javascript。掌握了这三门技术就算入门,但也仅仅是入门,现在前端开发的定义已经远远不止这些。前端小课堂(HTML/CSS/JS),本着提升技术水平,打牢基础知识的中心思想,我们开课啦(每周四)。 编码解码对于web开发来说,有可能最常见的是URL编码(encode decode)。
182 0