中国标准化协会标准 CAS STANDARDSOF CHINAASSOCIATION 183-2010 FORSTANDARDIZATION 基于HNC的现代汉语动词电子词典的 XML化文档 XMLfiles of HNC-based ElectronicDictionary of VerbsinContemporaryChinese 2010-12-30发布 索引号 CAS183-2010(C)
CAS183-2010 该标准为中国标准化协会制定,其为中国标准化协会。
除了 用于国家法律或事先得到中国标准化协会文字上的许可外,不许以任何 形式再复制该标准。
中国标准化协会地址:北京市海淀区增光路33号中国标协写字楼 邮政编码:100037电话:6848620668481778传真:68485356 网址:.china-cas.org 电子信箱:cas@china-cas.org
CAS 183-2010 前言 中国标准化协会(CAS)是组织开展国内、国际标准化活动的全国性社会团体。
制定中 国标准化协会标准(以下简称:中国标协标准),满足企业需要,推动企业标准化工作,这 也是中国标准化协会的工作内容之一。
中国境内的团体和个人,均可提出制、修订中国标协 标准的建议并参与有关工作。
中国标协标准按《中国标准化协会标准管理办法》进行管理,按CAS1.1-2001《中国 标准化协会标准结构及编写规则》的规定编制。
中国标协标准草案经向社会公开征求意见,并得到参加审定会议的75%以上的专家、 成员的投票赞同,方可作为中国标协标准予以发布。
本标准附录A、B、C为资料性附录。
本标准首次制定。
使用中国标准化协会标准的单位,应按现行国家有关规定办理标准备案,并对技术内容 负费。
在本标准实施过程中,如发现需要修改或补充之外,请将意见和有关资料寄给中国标准 化协会,以便修订时参考。
II
CAS183-2010 引言 XML(ExtensibleMarkupLanguage,可扩展标记语言)已经成为全球数据表示和数据交 换的标准,许多研究机构和组织都以XML为基础来建构通用的或行业的相关标准。
随着计 算机的发展和市场需求的增长,数字化和电子化成为现代词典编的趋势,各种形式的电子 词典相继出现。
与关系型数据库相比,XML可以更加方便有效地组织、存储和使用电子词 典信息。
首先,XML的树形结构更加适合描述词典的结构;其次,XML内容和显示分离的 特点便于灵活使用已编写好的词典内容;第三,XML还具有良好的可扩展性和交互性,可 以动态地更新数据的结构而不影响数据的有效性,并且其文档不依赖于特定类型的计算机软 硬件平台,可以方便地进行数据交换和信息共享。
这些优势使XML成为电子词典技术实现 的理想手段。
HNC(HierarchicalNetworkofConcepts,概念层次网络)理论是一个关于自然语言理解 处理的理论体系,它以语义为中心,以概念联想脉络为基础,建立了一种表述和处理自然语 言的新模式。
该理论不仅可应用于语言信息处理,而且对语言研究的其他许多方面都富有启 发意义。
词典编筹是HNC理论的一项重要应用。
本标准给出了基于HNC的现代汉语动词电子词典的XML化文档配套方案,对该词典 的XML文档和XSD文档进行了说明和规定,有利于电子词典数据的制作、使用、交换和 传播,有利于电子词典编的规范化和出版质量的提高。
本标准适用于各种基于HNC的现 代汉语动词电子词典XML化文档的设计与编写,其他电子词典的XML化文档也可以参考 使用本标准。
ⅢI
CAS 183-2010 基于HNC的现代汉语动词电子词典的XML化文档 1范围 本标准给出了基于HNC的现代汉语动词电子词典(以下简称:HNC动词词典)的XML 化文档配套方案,规定了该词典的XML文档和验证该文档有效性的XSD文档的基本结构 和内容。
本标准描述的HNC动词词典属于学习型现代汉语词典。
本标准适用于各种基于HNC的现代汉语动词电子词典XML化文档的设计与编写,其 他电子词典的XML化文档也可以参考使用本标准。
2规范性引用文件 下列文件对本文件的应用是必不可少的。
凡是注日期的引用文件,仅注日期的版本适用 于本文件。
凡是不注日期的引用文件,其最新版本(包括的修改单)适用于本文件。
GB/T15238-2000辞书编纂基本术语 GB/T15834-1995标点符号用法 GB/T15835-1995上数字用法的规定 GF1001-2001第一批异形词整理表 汉语拼音方案 中华人民共和国国家通用语言文字法 W3C Extensible Markup Language (XML) 1....