找回密码
 立即注册
搜索
热搜: 活动 通知
查看: 49|回复: 0

第12集的文字稿

[复制链接]

403

主题

307

回帖

3177

积分

管理员

积分
3177
发表于 2024-11-14 16:01:12 | 显示全部楼层 |阅读模式
001.
1980年年我国颁布了GB2312《信息交换用汉字编码字符集》基本集。该标准共收录了6763个汉字及常用符号,奠定了中文信息处理的基础。为了满足更广泛的应用需求,继GB2312之后又颁布了GB7589、GB12345、GB13131等5个辅助集标准,共收录了包括繁体字在内的近四万个汉字。


从1985到1995的十年中间,我国中文平台得到了极大的发展,积极地介入了国际软件技术革命的潮流之中,出现了各种中文平台以及建立在中文平台之上的词典、翻译工具、中文字处理和排版软件。这些汉字系统都是以GB2312-80为内码标准,并作了少量扩充开发出来的。由此可见信息交换用编码标准在我国软件产业及信息技术的发展过程所发挥的巨大作用。


随着我国对外开放的扩大及社会经济、文化领域国际间的交流与合作的加强,以及海峡两岸贸易往来的日益增加,特别是全球信息高速公路的建立与发展,信息处理应用对字符集编码提出了多文种、大字量、多用途的要求,要求简繁并存和增加汉字的呼声更加强烈。


1993年,经过ISO/IEC的组织,以及各成员国的积极努力,历经近十年终于出版发行了ISO/IEC 10646-1《信息技术通用多八位编码字符集(UCS)》,该标准立足于多个八位字节,包括了世界上近百种文字及各种符号,我国包括GB2312在内的几大汉字标准作为子集均收入在该标准中。


不过在当时,尽管ISO/IEC 10646能够满足更为广泛的需求,但它是一个新的体系结构,与现有系统GB 2312不兼容,要过渡到这个新的体系还需要一段时间。因此,基于GB 2312研究制定汉字内码扩展规范已成为当务之急。


全国信息技术标准化技术委员会从1995年5月开始会同国内主要系统开发厂商研究汉字内码扩展规范(简称为GBK)方案,经过3个月的紧张讨论与反复磋商,8月份完成方案的总体设计,12月份完成规范的制定工作。1995年年12月15日国家技术监督局标准化司和电子工业部科技与质量监督司联合发文将《汉字内码扩展规范(GBK)》作为技术规范指导性文件发布和实施。


GBK的“GB”是指GB2312标准,“K”是扩展的意思,汉字“扩”的汉语拼音的第一个字母。GBK不是国家标准,只是一个行业标准。


002.
GBK字符集采用多个8比特编码,而且兼容ASCII字符集。如果一个8比特的编码值小于128,即,这个8比特的最高位是0,表明它是一个ASCII字符。


和GB2312字符集一样,GBK字符集对汉字采用双8位编码。GB2312字符集中的字符及其编码保持不变。即,GBK是兼容GB2312的。


相比于GB2312,GBK的最大特点是字符更多。为了编码更多的字符,字符编码的第二个8位不要求最高位是1,但编码值大于十六进制的40。


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|鼠侠网 ( 吉ICP备19001332号 )

GMT+8, 2024-11-23 16:24 , Processed in 0.206136 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表