找回密码
 立即注册
搜索
热搜: 活动 通知
查看: 86|回复: 0

第2集的文字稿

[复制链接]

403

主题

307

回帖

3177

积分

管理员

积分
3177
发表于 2024-11-3 09:53:29 | 显示全部楼层 |阅读模式
我们人与人之间交流,一是用语言,你说我听;二是用文字,你写我看。文字是用来记录语言的符号,是语言的书面形式。

文字是需要有载体的,比如可以将它书写或者印刷在纸上。比如我们学习用的书和教材,上面印的就是文字。在电子计算机发明之前,文字的载体主要是纸张。当然了,在历史上也用过毛皮、树皮、木板、龟甲和兽骨、竹简、丝绸,等等。

在电子计算机发明之后,文字还可以保存在计算机里,然后在需要的时候予以显示和打印。当然了,手机和其它移动设备也是电子计算机,我们也可以用手机输入、保存、发送和接收文字信息。

但是,你要注意了,将文字保存在电子设备里,和书写在纸上是完全不同的。我们通过键盘输入文字,把文字保存在计算机里,保存的并不是文字的形状,而是一个一个的数字,不同的数字代表不同的文字。为了更好地理解象计算机这样的电子设备是如何处理文字的,我们需要回顾一下历史,回到几十年前。

键盘和显示器作为标准的终端设备,在当下是非常普遍和普通的,但在上世纪五、六十年代却不是这样。那个时候是没有显示器的,用的是电传打字机,它是打字机、打印机、卡片阅读机和纸带穿孔机的集合体。电传打字机的打印机可以在纸上打印字符,相当于现在的显示器;打字机呢,相当于现在的键盘。电传打字机可以把输入,也就是人类通过打字机进行的操作传送到计算机,而打印机则可以把计算机的响应打印在纸上。

在这幅图中,这个人面前就是一台电传打字机。这是一部电影的截图。电影里的主人公C.C.巴克斯特就职于联合保险公司的普通保单清算部,差不多有百十多号人,每人面前都有一个电传打字机,它们都连接到据说是IBM公司的大型主机上。

当时还没有个人计算机,有的只是非常昂贵的大家伙,称为主机。当时也已经有了多用户的操作系统,也就是允许很多人通过电传打字机来共享同一台电脑主机的计算能力。在这种情况下,每一台电传打字机就是一个终端。有些终端离主机很近,有些则很远,需要通过电话线和调制解调器来与主机连接。在这幅图中,这一屋子的设备就是大型主机,可以连接大量的终端。

在日常工作中,用户通过电传打字机把操作命令传送给主机,这类似于我们现在通过键盘输入文字命令。而主机呢,遵照命令执行操作,然后再把运行结果发送到电传打字机,电传打字机把它打印在纸上,这类似于我们现在的计算机通过显示器显示程序的运行结果。

在这个过程中,发送给主机的操作命令是一些文本,而主机的反馈既包括文本,也包括一些控制电传打字机动作的命令。比如命令电传打字机换行、换页、通信开始,通信结束,或者叫唤一声以提醒操作员注意。

在这个过程中,有一件事非常重要。什么事情呢?我们知道,在电传打字机和主机之间来回传送的是用电信号代表的数字。所以,用什么数字代表什么文字,或者用什么数字代表什么控制命令,这都必须达成一致,甚至必须制定一个标准,毕竟这些设备很可能来自不同的厂家,所以要制定一个所有厂家都遵守的标准。

制定标准的第一步是搞清楚主机和终端在通信时要用到哪些文字和控制命令;第二步是为这些文字和控制命令分配相应的数字。这些数字是这些文字和控制命令的代码或者叫编码。

世界上的语言文字很多,所以搜集文字并制定标准的工作并不是轻而易举的。然而在计算机发展早期,没有人会考虑那么长远,没有人会预料到计算机的应用能象今天这样广泛。在当时,美国人心想我发明的这玩意儿能处理26个英文字母、10个阿拉伯数字,外加一些符号就足够了,我不用考虑别的国家,只考虑我自己就行了。于是,在1967年,由美国国家标准协会牵头设计出了美国信息交换标准代码,简称ASCII,并一直使用到现在。当然,在此期间还有一些公司也发明了自己的文字代码表,但都不如ASCII具有生命力。

现在我们来看ASCII表,,,<简要介绍表中的内容>

在当时,这个表叫代码表,但以今天的眼光来看,这是一个字符的集合,简称字符集。什么是字符?从这个表中可知,字符包括图形字符和控制字符。图形字符是有形状,可以显示和打印的字符;控制字符没有形状,起控制设备的作用。

形成字符集的关键是选定字符。ASCII选定了美国人常用的128个字符。不过需要说明的,随着技术的进步,老的设备被淘汰,新的设备按不同的方式工作。所以,在今天,ASCII字符集里的大多数控制字符已经不再有用,因为支持这些控制字符的设备都已经成为古董,只有少数几个控制字符还在使用,而且依然存在于我们现在使用的键盘上,比如回车(cr)、换行(lf)、退格(bs)、删除(del),等等,它们用于控制屏幕的显示效果。

字符集只是一个字符的集合,要在电子设备之间交换信息,还必须就用什么数字来代表什么字符达成一致。为字符分配的数字叫字符编码或者字符代码,给字符制定编码的规则就是字符编码方案。

每个被选入字符集的字符,在整个字符集中的位置是固定的。从第一个字符开始,每个字符都有一个序号,这叫做代码点或者代码位置。code point/code position。比如在ASCII中,,,

然而,代码点并不是字符编码,它仅仅是一个数学意义上的数字,指示字符在字符表或者字符集中的位置。而字符编码(代码)呢,通常是由代码点转换而来,但是考虑到现实的需求和软硬件的限制,可能会有不同的编码方案。

对于象ASCII这样很小的字符集来说,字符的编码工作十分简单。美国人的做法是直接将代码点当字符编码来用。比如说,字符“A”是ASCII字符集内的编号是65,所以该字符的编码是65。

由于ASCII字符集内只有128个字符,所以只需要7个比特就能编码所有字符。现代的计算机每个字节至少有8个比特,在存储ASCII字符时,第8个比特是用不上的。

相比之下,汉字有好几万个,无论如何也不可能用一个字节来存储它们的编码。这怎么办呢?办法还是有的,但要在后面讨论。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|鼠侠网 ( 吉ICP备19001332号 )

GMT+8, 2024-11-23 16:07 , Processed in 0.207810 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表