组成文本基本元素是字符,字符与数值一下,在计算机中采用二进制编码表示。
我们常用的字符集有两类:分别为西文字符集和中文字符集。 西文字符集由拉丁字母、数字、标点符号以及一些特殊符号组成。
字符集中的每一个字符各有一个代码称为该字符的编码。
计算机中广泛使用西文字符集,编码是ASCII字符集和ASCII码,也称作美国标准信息交换码。
每个字符使用7位二进制数(b7b6b5b4b3b2b1)表示。范围为0~127(0000000~1111111),共128个字符,其中96个为可打印字符,32个为控制字符。
ASCII码是用7位二进制数表示,但是字节(一个字节=8位)是计算机中最基本的存储和处理单位,所以我们用一个字节来存放一个ASCII码,最前面一位置“0”不改变原来数的大小(0b7b6b5b4b3b2b1,),即编码范围为为00000000-01111111。
我们把0b7b6b5b4b3b2b1分为高四位(0b7b6b5)和低四位(b4b3b2b1),如下表所示。 高四位分别为0000/0001/0010/0011/0100/0101/0110/0111,低四位分别为0000/0001/0010/0011/0100/0101/0110/0111/1000/1001/1010/1011/1100/1101/1110/1111。
字符“A”的ASCII码为0100 0001,十进制为65。字符“a”的ASCII码为0110 0001,十进制为97,两个相同大小写字母十进制相差32。