开发者社区> 问答> 正文

Ascii、GBK、UTF、Unicode

Ascii、GBK、UTF、Unicode

展开
收起
kun坤 2019-11-28 16:13:48 294 0
1 条回答
写回答
取消 提交回答
  • 答案:

    Ascii(1 个字节 1 个字符)
    GBK 是国内的编码标准(汉字 2 个字节)
    Unicode 是国际编码标准(统一 2 个字节表示一个字符)
    UTF 是 Unicode 实现的另一个标准
    
        unicode 同样也不完美,这里就有两个的问题,一个是,如何才能区别 unicode 和 ascii?
        由于”半角”英文符号只需要用到低 8 位,所以其高 8 位永远是 0,因此这种大气的方案在保存英文文本时会多浪费一倍的空间
        unicode 在很长一段时间内无法推广,直到互联网的出现,为解决 unicode 如何在网络上传输的问题,于是面向传输的众多 UTF(UCS Transfer Format)标准出现了,顾名思义,UTF-8 就是每次 8 个位传输数据,而 UTF-16 就是每次 16 个位。UTF-8 就是在互联网上使用最广的一种 unicode 的实现方式,这是为传输而设计的编码,并使编码无国界,这样就可以显示全世界上所有文化的字符了。UTF-8 最大的一个特点,就是它是一种变长的编码方式。它可以使用 1~4 个字节表示一个符号,根据不同的符号而变化字节长度,当字符在 ASCII 码的范围时,就用一个字节表示,保留了 ASCII 字符一个字节的编码做为它的一部分,注意的是 unicode 一个中文字符占 2 个字节,而 UTF-8 一个中文字符占 3 个字节)。从 unicode 到 utf-8 并不是直接的对应,而是要过一些算法和规则来转换。
    
    2019-11-28 16:14:01
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载