简介

各个系统或者组件所存储或传输的字符编码不一致,所有就需要对不同编码进行转换。
整理了一些常用转码规则。
基本上世界统计编码是Unicode,所以各种字符集都可以转成unicode,然后再转成其它编码。

这里就有一个问题,当高字节的编码字符向低字节编码字符转换时会丢失正确字符

关于ASCII编码

关于Unicode编码

GBK到Unicode

这是两套不同的编码方案,没有直接关系。只能查内码映射表

image-1677656343863

GB18030到Unicode