1. 字符
在计算机和电信技术中,一个字符是一个单位的字形、类字形单位或符号的基本信息。说的简单点字符是各种文字和符号的总称。一个字符可以是一个中文汉字、一个英文字母、一个阿拉伯数字、一个标点符号、一个图形符号或者控制符号等。
2. 字符集
世界上有很多种文字,每种文字都有一套自己的字库。很多国家为了让计算机正常显示自己的文字,发明了套字符编码方式。这样每个字都有一个数字编码相对应。这种以数字编码应对所有字的集合,就是字符集。
常见的字符集有:ASCII GB2312 GBK BIG5 GB18030 Unicode等
3. 字符编码
计算机数据的存储及传输是以数字信号存在的.字符编码即统一套标准来在不同计算机之间存储传递信息。这一套以数字表示字符的过程,就是字符编码过程
常见编码: ASCII UTF-8 GB2313 GBK GB18030
3.1 区码
给每个字符编上号后,对应的数字叫区位码(code point)
3.2 内码
为了兼容等目的,将区码进行转换后存储的码叫做内码.
unicode 是一种给字符编号的方法,UTF8、UTF16则是把这个编号记录到文件里的方法。