找回密码
 立即注册
搜索
热搜: 活动 通知
查看: 26|回复: 0

第15集的文字稿

[复制链接]

407

主题

310

回帖

3203

积分

管理员

积分
3203
发表于 2024-11-18 14:55:44 | 显示全部楼层 |阅读模式
001.
上一课里讲过,在统一字符集UCS里,字符的代码点由平面、行和字位组成。显然,后面那些平面中的字符,其代码点在数值上较大。字符的编码是基于代码点的,如果代码点的数值较大,那将来编码的时候,字符的编码也就很长。因此,谁也不愿意把自己国家和地区的字符排在后面那些平面里。


为了照顾大家的情绪,统一字符集UCS把第一个平面,也就是平面0,拿出来优先安排每个国家和地区常用的字符。换句话说,这个区混杂了各个国家常用的字符,所以又称为基本多语种平面,Basic Multilingual Plane, BMP。


我们知道,每个平面有256个行,每一行有256个字位,所以每个平面可以有65536个字符。因此,用基本多语种平面BMP来容纳每个国家和地区的常用字符,基本上是足够了。至于每个国家和地区的那些不常用的字符,再安排到其它平面,这样大家都没有意见了。


由于世界上的语种很多,基本多语种平面的划分很细,分为很多个区。<这是国际标准化组织ISO的网站,这是最新的ISO/IEC 10646:2020标准,里面有基本多语种平面的结构图。>


<大致上,基本多语种平面的划分是这样的:


0到33行是一个非常复杂的区域,大体上包括:


1,基本拼音字符,包括所有拼音文字的字母拼音和音标。它的字符集一般較小,如:拉丁文、西里尔文、希腊文、希伯来文、阿拉伯文、泰文、梵文等。


2,基本符号,包括多种用于标点、数学、化学、科技和其它特殊用途的符号。


3,中日韩的符号和音标,包括用于中国、日本和韩国的标点、符号、字根、音标等。


34到4D行是中日韩统一表意扩展A区。CJK是Chinese、Japanese和Korea的首字母,代表中日韩。中文、日文和韩文中有很多本质上相同、形状一样或稍异的表意文字,为方便起见,在统一字符集UCS里赋予相同的编码,称之为CJK表意文字。


4E到9F行是CJK统一表意文字区。


A0到A4行是彝族文字。


后面还有很多,就不一一介绍,只重点注意D8到DF行的代理区,它的含义和作用在后面要讲到。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|鼠侠网 ( 吉ICP备19001332号 )

GMT+8, 2024-11-27 11:21 , Processed in 0.211760 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表