找回密码
 立即注册
搜索
热搜: 活动 通知
查看: 43|回复: 0

第10集的文字稿

[复制链接]

403

主题

307

回帖

3173

积分

管理员

积分
3173
发表于 2024-11-12 12:24:12 | 显示全部楼层 |阅读模式
001.
我们说过,对于美国和其它英语系国家,ASCII字符集足够了,但是在欧洲和其它一些国家,他们会有一些额外的文字和符号,但又不是特别多。


为此,国际标准化组织(ISO)及国际电工委员会(IEC)联合制定了一系列8位字符集的标准ISO/IEC 8859-1、ISO/IEC 8859-2,等等,一直到ISO/IEC 8859-16,每个标准对应一个字符集,一共定义了16个字符集。


要想具体了解每个标准都定义了哪些语言,可以到ISO/IEC的网站。这个链接是ISO/IEC 8859-1的链接,而且只有部分内容(全文是有版权的,需要购买),但可以看到该标准所定义的语言。在这个页面底部选择“parts”可以转到其它ISO/IEC 8859系列。


002.
ISO/IEC 8859标准基于ISO/IEC 2022标准的,所以它要使用7位编码空间的G区来编码那些国家的字符,但实际上也会使用编码值为32和127的这两个位置。显然,这些字符和ASCII字符集中的这一部分字符是重叠的,但是没有关系,ISO/IEC 8859标准采用8位编码,是兼容ASCII字符集和字符编码的。


003.
首先,如果是一个7比特的ASCII字符编码,直接在它前面加0扩充到8个比特,这个编码保持不变,这就保持了与ASCII字符集和字符编码的兼容性;


然后,对于刚才生成的7比特本地本国字符编码,直接将它加上128,结果就是本地本国字符的ISO/IEC 8859编码。因为128的二进制形式为10000000,加上128就等同于将7比特编码扩充到8个比特并将其最高位置1。


004.
因为这个原因,在每个ISO/IEC 8859系列的字符集中,前128个字符和ASCII字符集完全相同,中间有32个位置是空的,后面是本地本国的字符。




您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|鼠侠网 ( 吉ICP备19001332号 )

GMT+8, 2024-11-21 20:52 , Processed in 0.210056 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表