字符集介绍

什么是字符集?

我们在电脑显示器上看到的数字、标点符号、字母及汉字等符号,在电脑的硬盘里,都是以二进制存储的。电脑显示器上显示的符号,转换成一定格式的二进制,需要根据某种转换规则。

而字符集,就可以理解成这个转换规则。

那这种转换规则要考虑哪些呢?

它能把哪些字符转换成二进制,它能把哪些二进制转换成字符,对于不能转换的字符或二进制怎样处理?

例如,ascii字符集用于把英文字母、英文标点符号、数字等符号转换成二进制,如果把汉字用ascii字符集转换成二进制,当又用ascii字符集把二进制转换成字符时,由于用这个字符集不能把二进制转换成汉字字符,只能转换成该字符集限定的字符。最后,由于前后字符不对应,也就是乱码了。

比较规则介绍

比较规则,就是比较字符的规则。

显示器上显示的字符,在计算机底层,是以二进制表示的。我们对于显示器上字符的比较,实际上也是对于它们底层的二进制的比较。例如比较字符a与字符A,它们底层的二进制是不一样的,所以它们是不相等的。但在实际生活中,有些应用是不区分大小写的,在它看来,字符a和字符A是相等的。那么,对于这种要求,可以把字符统一转换成大写或小写,再进行比较。

由上述可知,比较字符就是比较表示字符的二进制。为了满足某些特定需求,我们可能需要对表示字符的二进制按某种规则进行转换后,再进行比较。