ANSI、ASCII、GB2312、GBK、Unicode、UTF-8

1. ANSI:获取当前操作系统的编码(在cmd中输入chcp,或者【cmd --> 属性 --> 选项】查看)

2. ASCII:英文字符(一个字节的 7 位)

3. GB2312:简体中文(其中包含了ASCII,最多两个字节表示)

  • 一个字节:和ASCII一致,其中 字节的第一位是 0
  • 两个字节:表示简体中文

4. GBK:简体中文 + 繁体(GB2312的升级,加入了繁体字,最多两个字节)

5. Unicode、UTF-8、UTF-16、UTF-32 :包含各国的字符

  • Unicode:每个字符表示都是等长
    【如果 Unicode 是用四个字节对各国的字符进行编码,那么 Unicode 表示一个英文字符,需要四个字节。而 ASCII 或者 GB2312 只需要一个字节。 --> Unicode 浪费空间】
  • UTF-8:可变长的编码方案,可以用1、2、3或者4个字节表示不同字符(一个字节:和ASCII一致)
    【UTF-8表示英文也只需要一个字节。】

上一篇:UTF-8,Unicode、ASCII和GBK


下一篇:presto安装集成kerberos