ICS35.240.01 L70 中华人民共和国国家标准 GB/T36335-2018 信息技术 藏文字符排序规范 InformationtechnologySpecificationforcollationofTibetancharacters 2018-06-07发布 2019-01-01实施 国家市场监督管理总局 发布 中国国家标准化管理委员会
GB/T36335-2018 目 次 前言 范围 2 规范性引用文件 3 术语和定义 4 藏文字符排序原则 2 附录A(资料性附录) 藏文音节和梵文转写藏文音节的一维展开 参考文献 6
GB/T36335-2018 前 言 本标准按照GB/T1.1一2009给出的规则起草。
请注意本文件的某些内容可能涉及专利。
本文件的发布机构不承担识别这些专利的责任。
本标准由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。
室、中国藏学研究中心、青海民族大学、西藏大学、中国科学院软件研究所、西北民族大学。
本标准主要起草人:黄鹤鸣、熊涛、多拉、欧珠、安见才让。
GB/T36335-2018 信息技术藏文字符排序规范 1范围 本标准规定了信息处理用藏文字符和梵文转写藏文字符排序原则。
注:包括但不限于GB/T13000-2010、GB16959-1997、GB/T20542-2006、GB/T22238-2008中所规定的藏文 字符和梵文转写藏文字符。
本标准适用于藏文信息处理。
2规范性引用文件 下列文件对于本文件的应用是必不可少的。
凡是注日期的引用文件,仅注日期的版本适用于本文 件。
凡是不注日期的引用文件,其最新版本(包括的修改单)适用于本文件。
GB/T13000一2010信息技术通用多八位编码字符集(UCS) GB16959一1997信息技术信息交换用藏文编码字符集基本集 3术语和定义 下列术语和定义适用于本文件。
3.1 字符character 供组织、控制或表示数据的元素集合中的一个元素。
3.2 字符串characterstring 能看作一个单独对象的字符序列。
3.3 编码字符codedcharacter 被赋予编码的字符。
3.4 图形字符graphiccharacter 不同于控制功能的字符,通常具有书写、打印或显示的可视表示。
3.5 占位字符spacingcharacter 显示时占用宽度的字符。
3.6 不占位字符non-spacingcharacter 显示时不占用宽度的字符,用于和前导的字符串相组合 注:前导的字符串可能是一个占位字符也可能由一个占位字符和几个不占位字符构成的序列。
3.7 梵文转写藏文字符transliteratingTibetancharacter GB/T13000-2010和GB16959一1997所收集的梵文转写藏文字母以及由这些字母的垂直组合 1
GB/T36335-2018 形成的字符。
3.8 第一类元音typeonevowel 元音、、、、、、、、、、、以及 3.9 第二类元音typetwovowel 元音&和8。
3.10 排序collation 给定字符或者字符串之间的先后顺序。
3.11 排序元素collationelement 为了实现字符间的排序而为每个字符赋予的数值。
4藏文字符排序原则 4.1藏文符号、数字以及字母间的顺序 藏文中符号、数字以及字母间的先后顺序为: 、g、、、、a、、、、、、、3、、、、、111、i、、、一、、、、、、、、、 # 、、a、=、、、、、、P、N、5、、、、、、、、、、、、、、、、、、、、m、M 同一个辅音字母的不占位字符要排在占位字符的后面。
因此,辅音字母的占位字符和不占位 字符间的先后关系为:、、、B、、、、、S、、、、。
字母、、、作为下加辅音时,相应的不占位字符间的顺序为:、、、。
图形符号分解成、、&后进行排序。
符串的序性。
符号、、、、、、、、、3、、、、1、11、、、、、、、、、、日、、、0、、 、、xx、ox、、、、、、、、、、、、、、、、、、x可以不参与排序,这些字符是否参与 排序由用户来决定。
4.2藏文音节的排序 4.2.1藏文音节通用结构 典型的藏文音节由基本辅音字母、前加辅音字母、上加辅音字母、下加辅音字母、元音符号、后加辅 音字母以及又后加辅音字母组成。
有些藏文音节有两个下加辅音,而有些梵文转写藏文字符有两个元 音。
因此,藏文音节的通用结构应包含基本辅音字母、前加辅音字母、上加辅音字母、第一下加辅音字 母、第二下加辅音字母、第一类元音符号、后加辅音字母/第二类元音符号以及又后加辅音字母,如图1 所示。
2...